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内 容 om 介 


本 书 以 来 自 于 确定 性 非 线性 系统 的 观测 或 实验 时 间 序 列 为 研究 对 象 ， 
在 对 问题 的 背景 和 意义 进行 分 析 的 基础 上 ,很 据 目前 国内 外 关于 单 变 基 非 
线性 时 间 序 列 分 析 的 相关 文献 ,总 结 了 单 变量 非 线性 时 间 分 析 的 基本 流程 ， 
对 单 变量 非 线 性 时 间 序 列 分 析 的 基本 方法 进行 了 详细 综述 。 由 于 实际 问题 
中 常常 可 以 获得 多 变量 时 间 序 列 , 本 书 把 单 变 基 非 线 性 时 间 序 列 分 析 方法 
推广 到 多 变 基 非 线性 时 间 序列 的 情形 ,着 重 研究 了 基于 多 变 基 时 间 序 列 的 
系统 非 线性 性 检验 方法 、 多 变 其 时间 序 列 相 空 间 重 构 方 法 和 多 变 基 非 线性 
时 间 序 列 的 预测 方法 等 ,最 后 把 这 些 方法 应 用 到 证 券 市 场 的 指数 时 间 序列 中 。 

本 书 自 成 体系 ,可 作为 系统 工程 ,管理 科学 .金融 工程 .应 用 数学 .生物 
医学 上 程 ,信号 处 理 等 专业 高 年 级 本 科 生 、 研 究 生 和 从 事 相关 领域 研究 的 科 
技工 作者 的 参考 书 。 
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前 6B 


近年 来 , 非 线性 科学 得 到 了 快速 发 展 。 实 际 问题 中 ,面临 大 量 复杂 而 无 法 直接 
建立 解析 数学 模型 的 非 线性 系统 ,对 这 些 非 线性 系统 可 以 通过 实验 或 观测 的 手段 
获得 非 线 性 时 间 序 列 , 这 些 非 线性 时 间 序 列 中 蕴含 着 丰富 的 系统 动力 学 信息 ,如 何 
提取 这 些 信息 并 应 用 到 实际 问题 中 去 解释 ,分 析 ,甚至 控制 原来 的 复杂 系统 是 非 线 
性 时 间 序 列 应 用 的 一 个 重要 方面 .从 20 世纪 80 年 代 以 来 , 非 线性 时 间 序 列 分 析 的 
相关 理论 已 取得 了 许多 重大 成 果 , 在 实际 复杂 系统 中 也 得 到 了 有 效 的 应 用 ,为 解决 
实际 问题 中 像 经 济 系统 .生理 系统 .电力 系统 等 这 些 用 传统 的 确定 性 和 随机 性 方法 
都 无 法 很 好 刻画 的 复杂 系统 提供 了 一 种 全 新 的 研究 工具 。 

基于 混沌 理论 的 非 线 性 时 间 序列 分 析 目前 在 许多 领域 都 引起 广泛 兴趣 ,其 中 
的 某 些 成 果 已 在 国内 外 得 到 应 用 ,但 目前 国内 系统 介绍 这 方面 的 著作 还 很 少 ,应 用 
工作 多 是 某 一 具体 方法 在 实际 问题 中 的 应 用 ,缺乏 对 理论 和 应 用 的 系统 总 结 。 作 者 
在 给 相关 专业 的 博士 生 和 硕士 生 上 课时 对 非 线 性 时 间 序列 分 析 方 法 进行 过 介绍 ， 
引起 了 学 生 的 广泛 兴趣 ,所 以 在 本 书 第 二 章 对 目前 得 到 广泛 应 用 的 单 变量 非 线性 
时 间 序 列 的 基本 流程 进行 了 总 结 和 归纳 ,对 其 分 析 方法 进行 了 详细 综述 。 同 时 作者 
结合 近年 来 把 单 变 其 非 线 性 时 间 序列 分 析 方法 推广 到 多 变量 非 线性 时 间 序 列 情形 
的 研究 实践 ,在 本 书 第 三 至 第 五 章 详 细 介绍 了 基于 多 变量 时 间 序 列 的 系统 非 线性 
性 检验 方法 ` 多 变量 时 间 序列 相 空间 重 构 方法 和 多 变量 非 线性 时 间 序 列 的 预测 方 
法 等 ,并 在 第 六 章 把 这 些 方法 应 用 到 证 券 市 场 的 指数 时 间 序列 中 , 且 进行 了 实证 分 
析 。 本 书 介绍 的 非 线性 时 间 序 列 分 析 方 法 ,也 可 应 用 到 其 他 领域 ,例如 ,经 济 系 统 的 
汇率 时 间 序 列 . 生 理 系统 的 心 ( 或 脑 ) 电 图 时 间 序 列 . 电 力 系统 电力 负荷 时 间 序列 、 
水 文 预报 的 水 沙 ( 或 流量 ) 时 间 序列 .机 械 系统 故障 诊断 的 振动 信号 检测 时 间 序 
列 等 。 

本 书 内 容 自 成 体系 ,学 术 上 力求 完整 严谨 ,应 用 上 力求 通俗 易 懂 , 把 复杂 问题 
用 简单 的 语言 说 清楚 ,使 对 这 一 领域 感 兴趣 的 读者 通过 对 本 书 的 阅读 能 很 快 进入 
这 一 领域 并 掌握 非 线性 时 间 序 列 分 析 这 一 工具 。 对 理论 性 较 强 的 内 容 和 相关 的 应 
用 成 果 , 本 书 标注 了 大 量 的 参考 文献 ,使 不 同学 科 领 域 的 读者 可 以 通过 本 书 对 非 线 
性 时 间 序 列 分 析 这 一 领域 有 一 个 较 全面 的 了 解 。 

本 书 在 写作 过 程 中 参考 或 引用 了 许多 学 者 的 资料 ,作者 已 尽 可 能 在 文中 作 了 
标注 ,并 在 参考 文献 中 列 出 ,在 此 ,说 对 他 们 表示 衷心 的 感谢 。 若 某 些 引 用 的 资料 由 
于 作者 朴 忽 没有 标注 其 出 处 ,作者 深 表 才 意 。 


siis 非 线性 时 间 序列 分 析 及 其 应 用 


本 书 由 王海燕 负责 全 书 结构 的 策划 和 具体 的 撰写 , 卢 山 负责 相关 仿真 分 析 的 
具体 计算 ,研究 生 汤 龙 坤 . 朱 梅 . 钱 志 强 、 赵 狗 、 方 芬 等 在 仿真 分 析 中 也 做 了 大 量具 
体 工作 , 借 此 机 会 向 他 们 表示 惠 心 的 感谢 。 

本 书 得 到 了 东南 大 学 科技 出 版 基金 的 资助 ,在 此 表示 衷心 的 感谢 。 

由 于 非 线性 时 间 序 列 分 析 及 其 应 用 是 理论 和 实践 都 很 强 的 研究 领域 , 尚 有 许 
多 问题 有 待 深入 分 析 和 研究 ,因此 书 中 难免 有 不 足 之 处 ,恳请 读者 批评 指正 。 


GA 
2006 年 6 月 于 东南 大 学 


绪论 … een eee 
— 
非 线 性 时 间 序 列 的 例子 
研究 非 线性 时 间 序 列 的 意义 
单 变量 非 线 性 时 间 序 列 分 析 … 
非 线性 时 间 序 列 分 析 流 程 ' 
相 空间 重 构 …………… 
2.2.1 延迟 时 间 间 隔 的 确定 
2.2.2 殿 入 维 数 的 确定 “ 
几何 不 变量 的 计算 
2.3.1 关联 维 数 … 
2.3.2 Kolmogorov Afi &l Renyi 炳 
2.3.3 Lyapunov ffr eren 
观测 时 间 序 列 平稳 性 的 检验 
基于 观测 时 间 序 列 的 系统 非 线 性 性 检验 … 
2.5.1 罕 假 设 及 替代 时 间 序 列 的 约束 生成 算法 n 
2.5.2 判别 统计 量 的 选取 … 

2.5.8 统计 检验 方法 …… 
基于 观测 时 间 序 列 的 系统 确定 性 检验 … 
2.6.1 从 非 线 性 预测 判断 系统 的 确定 性 … 
2.6.2 利用 递归 图 判断 系统 的 确定 性 … 
观测 时 间 序 列 噪声 处 理 技术 … 
2.7.1 噪声 级 别 的 估计 “ 
2.7.2 ”噪声 的 降低 += 
基于 多 变量 时 间 序 列 的 系统 非 线 性 性 检验 
BEAL AS HEY ACHETER A IR 
时 间 序 列 广义 元 余 的 计算 
3.2.1 直方 图 及 盒 计数 法 …… 
3.2.2 关联 积分 计算 法 
系统 非 线 性 性 的 定性 和 定量 检验 
3.3.1 系统 非 线性 性 的 定性 检验 …… 


非 线性 时 间 序列 分 析 及 其 应 用 


4.3 


4.4 


4.5 
第 五 章 
5.1 


5.2 


5.3 


多 变量 时 间 序 列 相 空间 重 构 
多 变量 时 间 序 列 相 空间 重 构 的 流程 
多 变量 时 间 序 列 中 变量 间 的 依赖 关系 

4.2.1 随机 变量 间 统 计 依赖 性 的 度量 方法 

4.2.2. 观测 时 间 序列 统计 依赖 性 的 计算 

4.2.3 应 用 举例 … * 

多 变量 时 间 序列 相 空 间 重 构 参 数 的 确定 

4.3.1. 利用 预测 误差 最 小 法 确定 嵌入 维 数 

4.3.2. 利用 虚假 最 近邻 点 法 确定 嵌入 维 数 ee 

4.3.3. 虚假 最 近邻 点 法 确定 嵌入 维 数 算法 的 改进 

4. 3.4 人 嵌入 维 数 算法 的 仿真 计算 … 
AO EAL SH ARR IIO 

441 广义 关联 维 数 的 计算 cmm 

4.4.2. 小 数据 基 情 况 下 最 大 Lyapunov 指数 的 计算 
多 变量 时 间 序 列 相 空 间 重 构 中 噪声 的 影响 

多 变量 非 线性 时 间 序 列 预测 方法 ……… 
多 变量 非 线 性 时 间 序 列 的 局 域 预测 法 “ 
5.11 局 部 平均 预测 法 … 

5.1.2. 局 部 线性 预测 法 

5.1.8. 局 部 多 项 式 预测 法 … 
多 变量 非 线性 时 间 序列 的 全 域 项 测 法 - 

521 多 项 式 通 近 预 测 法 … diee 

5.2.2. 神经 网 络 预测 法 
5.2.3 径 向 基 函 数 预测 法 … 


各 种 预测 方法 的 预测 效果 对 比分 析 - 112 
5.3.1 预测 效果 评价 112 
5.3.2 仿真 比较 e 113 
基于 正则 化 的 多 变量 非 线性 时 间 序 列 预测 方法 - 17 
5.1 奇异 值 分 解 … 

5.4.2 最 小 二 乘 估计 

5.4.3 正则 化 估计 tmn menn nnne 


5.4.4 基于 正则 化 的 局 部 线性 和 局 部 多 项 式 预 测 的 步骤 
5.4.5 Lorenz 系统 的 仿真 模拟 … 


H 录 ove 


5.5 


第 六 章 
6.1 


6.2 


6.3 


6.4 


参考 文献 


基于 正则 化 的 多 变量 非 线性 时 间 序 列 的 自 适应 预测 方法 
5.5.1 基于 正则 化 的 自 适应 预测 的 步骤 
5.5.2 Henon 映射 的 仿真 检验 
非 线 性 时 间 序 列 分 析 法 在 证 券 市 场 中 的 应 用 ……………… 
基于 单 变量 时 间 序 列 的 证 券 市 场 非 线性 性 和 确定 性 检验 - 
6.1.1 样本 数据 及 平稳 化 处 理 … 
6.1.2 证券 市 场 的 非 线性 性 检验 
6.1.3 证 券 市 场 的 确定 性 检验 
基于 多 变量 时 间 序 列 的 证 券 市 场 非 线性 性 检验 - 
6.2.1 样本 数据 及 平稳 化 处 理 0 
6.2.2 证 券 市 场 的 非 线 性 性 检验 
LOEAN EAER BEATA 
6.3.1 样本 数据 及 相 空 间 重 构 see 

6.3.2 基于 正则 化 的 自 适应 预测 - 
上 海 证 券 市 场 多 变量 指数 序列 的 预测 研究 
6.4.1 样本 数据 及 相 空 间 重 构 
6.4.2 局 部 多 项 式 预测 —— 
6. 4.3 基于 正则 化 的 局 部 线性 和 局 部 多 项 式 预 测 


第 一 章 绪 it 


对 实际 问题 中 动力 系统 进行 研究 的 一 种 常用 方法 是 通过 对 系统 本 身 的 性 质 分 
析 , 用 差分 方程 或 微分 方程 建立 系统 的 数学 模型 ,然后 通过 对 数学 模型 的 分 析 来 研 
究 系 统 的 演化 规律 。 从 数学 上 看 ,这 是 一 个 正 问题 ,系统 的 演化 规律 能 否 正确 刻画 
取决 于 对 系统 所 做 的 假设 和 在 此 假设 基础 上 所 建立 的 数学 模型 的 正确 性 。 实 际 问 
题 中 有 些 系统 很 难 通过 这 种 方法 来 建立 数学 模型 ,如 像 经 济 系统 、 生 理 系统 、 社 会 
系统 等 要 建立 精确 的 解析 模型 是 非常 困难 的 。 但 对 这 些 系统 通过 实验 或 观测 可 以 
获得 包含 系统 演化 信息 的 时 间 序 列 , 需 要 研究 的 是 能 否 通过 这 些 时 间 序 列 本 身 去 
获取 所 研究 系统 的 相关 信息 以 及 如 何 通过 这 些 时 间 序列 去 揭示 所 研究 系统 的 演化 
行为 。 从 数学 上 看 ,这 是 一 个 反问 题 , 它 对 所 研究 系统 本 身 的 背景 信息 和 知识 要 求 
较 少 ,只 是 从 获取 的 时 间 序 列 本 身 出 发 进行 研究 ,因此 研究 起 来 会 更 困难 ,但 对 那 
些 无 法 建立 精确 解析 模型 的 实际 系统 提供 了 一 种 新 的 研究 方法 。 时 间 序列 分 析 法 
正 是 从 这 样 的 角度 去 研究 复杂 系统 演化 行为 的 一 种 方法 。 


1.1 时 间 序 列 的 含义 及 分 类 


从 纵向 看 ,时 间 序 列 是 指 存在 于 自然 科学 或 社会 科学 中 的 某 一 变量 或 指标 的 
数值 或 观测 值 , 按 照 其 出 现时 间 的 先后 次 序 , 以 相同 的 或 不 同 的 间隔 时 间 排 列 的 一 
组 数值 。 它 是 某 一 现象 或 若干 现象 在 不 同时 刻 上 的 状态 所 形成 的 数据 ,反映 的 是 现 
象 以 及 现象 之 间 关 系 的 发 展 变化 规律 从 横向 看 ,时 间 序 列 也 可 以 是 若干 相关 现象 
在 某 一 时 间 点 上 所 处 的 状态 按 一 定 顺 序 排序 的 一 组 数据 ,反映 的 是 一 定时 间 、 地 点 
条 件 下 各 相关 现象 之 间 存 在 的 内 在 数值 联系 。 因 此 ,从 系统 的 意义 上 看 ,时 间 序 列 
就 是 某 一 系统 在 不 同时 间 ( 地 点 ,条 件 等 ) 的 响应 。 

时 间 序 列 是 指 所 研究 系统 的 历史 行为 的 客观 记录 ,因而 它 包 含 了 系统 结构 特 
征 及 其 运行 规律 ,所 以 可 通过 对 时 间 序 列 的 研究 来 认识 所 研究 系统 的 结构 特征 , 揭 
示 所 研究 系统 的 运行 规律 ,进而 用 以 预测 、 控 制 其 未 来 行为 ,修正 和 重新 设计 系统 . 
使 之 按照 希望 的 结构 运行 。 

时 间 序 列 根据 研究 的 出 发 点 不 同 , 可 以 有 不 同 的 分 类 。 

1) 按 研究 系统 复杂 程度 不 同 , 可 以 分 为 线性 时 间 序 列 和 非 线 性 时 间 序 列 。 线 
性 时 间 序 列 是 指 从 线性 系统 通过 观察 或 实验 获取 的 时 间 序列 。 而 非 线性 时 间 序列 
是 指 从 非 线 性 系统 通过 观察 或 实验 获取 的 时 间 序 列 。 线 性 时 间 序 列 比较 简单 ,可 以 


"2 非 线性 时 间 序 列 分 析 及 其 应 用 


通过 线性 回归 等 方法 建立 数学 模型 进行 分 析 ; 非 线性 时 间 序列 比较 复杂 ,直接 建立 
数学 模型 比较 困难 ,有 时 甚至 具有 混沌 特征 或 分 形 特征 。 

2) 按 研 究 系统 的 确定 性 程度 不 同 ,可 以 分 为 随机 时 间 序 列 和 确定 性 时 间 序 
列 。 随 机 时 间 序 列 是 指 从 随机 系统 通过 观察 或 实验 获取 的 时 间 序 列 , 一 般 用 统计 分 
析 方 法 进行 研究 。 确 定性 时 间 序 列 是 指 从 确定 性 系统 通过 观察 或 实验 获取 的 时 间 
序列 ,可 以 通过 建立 确定 性 数学 模型 进行 研究 ,但 当 确定 性 系统 具有 混沌 特征 时 ， 
对 这 样 的 时 间 序列 进行 分 析 会 非常 复杂 。 

3) 按 研究 系统 的 观察 变量 多 少 不 同 ,可 以 分 为 单 变量 时 间 序 列 和 多 变量 时 间 
序列 。 单 变量 时 间 序 列 是 指 从 系统 中 只 观察 一 个 量 所 得 到 的 时 间 序列 。 多 变量 时 
间 序 列 是 指 从 系统 中 同时 观察 多 个 变量 所 得 到 的 多 维 时 间 序 列 。 多 变量 时 间 序列 
中 观察 量 之 间 可 能 是 相关 的 ,这 样 的 多 变量 时 间 序 列 就 有 宛 余 。 

本 书 研 究 的 时 间 序 列 主要 是 指 来 自 于 非 线 性 确定 性 系统 的 实测 单 变量 或 多 变 
量 时 间 序 列 。 


1.2 非 线性 时 间 序 列 的 例子 


来 自 于 非 线 性 确定 性 系统 的 时 间 序列 具有 各 种 各 样 的 特性 ,有 些 随时 间 的 演 
化 会 趋向 于 一 个 稳定 的 状态 ,有 些 随时 间 的 演化 会 周期 性 变化 ,还 有 些 随时 间 的 演 
化 会 表现 出 看 起 来 是 随机 的 行为 。 

1. 趋向 于 稳 完 状 态 的 时 间 序 列 


例 1.1 考虑 以 下 Logistic 模型 
Zayi = Rz,(l — x,) (1.1) 
34 R=1.5 时 ,不 管 初始 状态 ro 在 何 处 ,随时 间 的 演化 ,系统 都 将 单调 地 趋向 
limp 1.1 所 示 (zo 一 0.7)。 
当 R=2.9 时 ,不 管 初始 状态 z 在 何 处 ,随时 间 的 演化 ,系统 都 将 交替 地 趋向 
于 起 ,如 图 1.2 所 示 (zo 一 0.7)。 
P 2 弹簧 振子 在 策动 力 、 弹 性 力 和 阻尼 力 的 作用 下 做 受 迫 振动 ,其 振动 方 


程 为 


g. 
dz + gd di + wix = focosat a.2) 


取 物 体 所 受 的 最 大 策动 力 fo 二 100, 策 动力 的 频率 “一 1 ,振动 物体 的 固有 频率 


mw 一 0, 阻 尼 因 子 8=0.1。 当 初 值 z(0)==5,z'(0)=0 时 ,随时 间 的 演化 ,系统 将 趋 
于 稳定 状态 ,如 图 1.3 所 示 。 
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图 1.2 Logistic 模型 中 R— 2. 9 时 的 时 间 历 程 图 
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不 管 初始 状态 xo eM soit. m 0.48 和 
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周期 性 地 变化 ,如 图 1.4 所 示 (zo 一 0.7) 


之 间 
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例 1.4 弹簧 振子 在 策动 力 、 弹 性 力 和 阻尼 力 的 作用 下 做 受 迫 振动 ,其 振动 方 
程 为 
dir dz 
de + 2P de + wz = focosat a. 4) 
取 物 体 所 受 的 最 大 策动 力 fo 二 100, 策 动力 的 频率 “一 1, 振 动物 体 的 固有 频率 


wn 一 1, 阻 尼 因 子 8—0. 1。 当 初 值 x(0)=5,z'(0) 王 0 时 ,随时 间 的 演化 ,系统 将 趋 
于 周期 性 变化 状态 ,如 图 1. 5 所 示 。 


EU] 
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图 1.5 无 阻尼 的 振动 方程 的 时 间 历 程 图 


3. 混沌 时 间 序 列 


例 1.5 考虑 以 下 Logistic 模型 
Tapi = 4x — n) (1.5) 
随时 间 的 演化 ,系统 将 出 现 不 规则 的 振荡 ,看 起 来 好 像 是 随机 的 ,如 图 1.6 
TE Logistic 模型 (1.5) 中 , 初 值 的 微小 变化 随 着 时 间 的 演化 会 不 断 放大 ， 
表 1. 1 是 Logistic 模型 (1. 5) 的 三 个 非常 接近 的 初 值 演化 50 次 后 的 结果 。 可 以 看 
到 刚 开始 时 演化 结果 非常 接近 ,但 随 着 演化 次 数 的 增加 ,演化 结果 不 断 分 离 , 最 后 
甚至 变 得 毫 无 关系 ,表明 系统 对 初 值 具有 非常 敏感 的 依赖 性 ,也 说 明 这 样 的 系统 只 
能 进行 短期 预测 ,要 进行 较 长 时 间 的 预测 会 变 得 不 正确 。 
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图 1.6 Logistic 模型 中 R=4 时 的 时 间 历 程 图 
表 1.1 Logistic 模型 (1. 5) 在 不 同 初 值 下 的 演化 结果 


"m 


zin 


sone 


eo c 3 6c 


100 000 000 000 000 0 
- 360 000 000 000 000 0 
j. 921 600 000 000 000 0 
- 289 013 760 000 000 1 
821 939 226 122 649 8 
. 585 405 387 334 197 4 
. 970 813 326 249 438 0 
. 113 339 247 303 761 2 
. 401 973 849 297 512 3 
. 961 563 495 113 812 8 
. 147 836 559 913 285 3 
|. 503 923 645 865 163 6 
999 938 420 012 499 1 
000 246 304 781 624 1 
). 000 984 976 462 314 7 
003 936 025 134 733 6 
. 015 682 131 363 489 3 
. 061 744 808 477 550 3 


ececesceeee eee ee ee eee 


eeeseceseece eee ee2ee°2°9 9 


. 100 000 010 000 000 0 
. 360 000 031 999 999 6 
. 921 600 035 839 995 4 
. 289 013 639 118 858 4 
821 939 022 088 530 7 
. 585 421 064 226 722 4 
. 970 812 967 145 496 7 
. 113 340 599 870 613 8 
. 401 978 033 166 332 8 
. 961 566 776 072 237 8 
147 824 444 905 122 6 
. 503 889 513 574 460 0 
. 999 939 486 736 616 4 
. 000 242 038 406 114 3 
j. 000 967 919 294 097 3 
. 003 867 929 705 349 5 
. 015 411 875 300 575 8 
). 060 697 397 601 181 4 


escecesceeeee eee eee22°°e°9 


- 100 000 020 000 000 0 
. 360 000 063 999 998 4 
. 921 600 071 679 981 8 
. 289 013 518 237 736 8 
821 938 818 054 328 7 
. 585 421 589 719 127 5 
970 812 608 039 428 2 
. 113 341 952 444 447 2 
. 401 982 217 042 111 4 
. 961 570 056 896 080 9 
. 147 812 330 307 794 6 
.503 855 381 267 096 2 
. 999 940 544 141 141 3 
|. 000 237 809 295 438 2 
- 000 951 010 968 708 6 
|. 003 800 426 187 384 2 
. 015 143 931 792 713 7 
. 059 658 372 490 285 4 
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BR 
n aj a Eu 
19 0. 231 729 548 414 483 7 0.228 052 894 102 501 9 0. 224 397 004 328 382 9 
20 0.712 123 859 224 412 5 0. 704 179 086 375 899 8 0.696 171 955 107 322 4 
21 0. 820 013 873 390 966 5 0.833 243 602 746 811 4 0. 846 066 256 117 482 7 
22 0. 590 364 483 349 241 7 0.555 794 804 913 301 4 0.520 952 585 507 315 6 
23 0. 967 337 040 596 098 5 0. 987 547 758 978 746 6 0.998 243 956 642 234 5 
24 0. 126 384 361 947 522 4 0.049 188 730 859 208 1 0.007 011 838 677 964 5 
25 0. 441 645 420 010 560 2 0. 187 076 798 462 674 1 0.027 850 691 185 274 7 
26 0.986 378 971 977 024 3 0. 608 316 279 758 520 4 0. 108 300 120 743 108 5 
27 0.053 741 982 474 292 1 0. 953 070 334 157 095 7 0. 386 284 818 360 546 6 
28 0. 203 415 127 176 099 9 0.178 909 089 227 110 4 0. 948 275 429 858 824 5 
29 0. 648 149 652 848 124 1 0.587 602 508 076 145 0 0. 196 196 555 939 544 4 
30 0.912 206 721 443 921 2 0.969 303 202 315 075 8 0.630 813 869 508 022 5 
31 0.320 342 475 185 814 1 0. 119 018 017 187 260 0 0.931 550 926 177 352 3 
32 0. 870 892 695 110 560 7 0.419 410 915 088 292 4 0.255 055 192 461 877 9 
33 0. 449 754 434 854 498 7 0.974 021 597 572 374 4 0. 760 008 165 040 449 3 
34 0. 989 901 532 732 836 8 0. 101 214 100 139 735 8 0. 729 583 016 449 193 9 
35 0.039 985 952 904 069 1 0. 363 879 224 290 557 4 0. 789 166 554 232 356 7 
36 0. 153 548 305 897 690 6 0.925 884 537 681 038 5 0.665 530 815 653 542 0 
37 0.519 884 894 614 559 3 0. 274 489 442 256 832 4 0.890 398 196 276 292 4 
38 0.998 418 363 864 671 5 0. 796 579 953 385 461 8 0. 390 356 993 376 870 0 
39 0. 006 316 538 249 855 6 0. 648 161 324 999 509 2 0.951 913 644 394 561 1 
40 0.025 106 558 377 574 7 0.912 192 887 097 559 3 0. 183 096 232 040 104 9 
4l 0. 097 904 876 416 032 6 0. 320 388 095 304 714 9 0.598 288 007 411 283 7 
42 0.353 278 046 359 975 8 0.870 958 254 766 927 3 0.961 357 870 396 4777 
43 0.913 890 673 280 218 5 0. 449 559 892 881 101 7 0.148 595 661 692 907 6 
44 0. 314 778 042 286 589 9 0. 989 823 182 375 336 2 0. 506 059 964 075 818 1 
45 0. 862 771 305 523 246 9 0. 040 293 000 030 792 6 0.999 853 107 341 599 2 
46 0.473 587 919 555 836 3 0. 154 677 896 717 244 7 0.000 587 484 323 791 0 
47 0. 997 209 608 026 444 0 0. 523 010 579 937 496 3 0. 002 348 556 743 841 2 
48 0.011 130 422 744 759 7 0. 997 882 052 843 760 4 0. 009 372 164 100 248 7 
49 0.044 026 145 737 130 6 0. 008 453 845 824 331 8 0.037 137 306 561 306 9 
50 0.168 351 376 914 6543 | 0- 033 529 513 260 441 1 0. 143 032 508 090 713 6 
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例 1.6 考虑 以 下 Lorenz 系统 
Ei ay 2) 


dy _ 


oY = rr 2) -y (1.6) 
E L zy 一 和 
其 中 
= 10,r=28,6= $ 


取 初 值 zo= 15. 34, yo= 13. 68,zo 一 37. 91, 利 用 四 阶 Runge-Kute 法 积分 ,积分 
PK A=0. 04, 得 关于 变量 的 长 为 8500 的 时 间 序 列 。 为 了 减少 瞬 态 的 影响 ,去掉 
前 5000 个 数据 , 剩 下 的 3500 个 数据 的 时 间 历 程 如 图 1. 7 所 示 。 
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图 1.7 Lorenz 系统 变量 x 的 时 间 历 程 图 


从 图 1. 7 中 可 以 发 现 ,随时 间 的 演化 ,系统 将 出 现 不 规则 的 振荡 ,看 起 来 好 像 
是 随机 的 ,实际 上 此 时 系统 是 混沌 的 。 


4. 实际 问题 中 的 实测 时 间 序 列 


实际 问题 中 有 大 量 的 时 间 序 列 , 如 天 文中 的 太阳 黑子 时 间 序 列 ,水 文中 的 径流 
量 时 间 序 列 、 气 象 中 的 降雨 量 时 间 序 列 、 生 理 系统 中 的 心电图 时 间 序 列 和 经 济 系统 
中 的 股票 指数 时 间 序 列 等 。 
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例 1.7 股票 指数 时 间 序 列 。 
图 1.8 是 从 1999 年 1 月 4 日 至 2003 年 12 月 31 日 的 上 海 证 券 市 场 综合 股指 
时 间 序 列 , 共 1196 个 数据 ,可 以 看 出 股票 指数 时 间 序 列表 现 为 非常 复杂 的 演化 行为 。 
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图 1.8 上 海 证 券 市 场 综合 股指 时 间 序 列 历程 图 
例 1.8 太阳 黑子 数 时 间 序 列 。 


图 1. 9 是 1700 年 以 来 的 太阳 黑子 数 时 间 序 列 , 可 以 看 出 太阳 黑子 时 间 序列 也 
表现 为 非常 复杂 的 演化 行为 。 


太阳 黑子 数 


上 
图 1.9 太阳 黑子 数 时 间 序 列 历程 图 


+10° 非 线性 时 间 序 列 分 析 及 其 应 用 


从 上 面 的 时 间 序 列 例子 可 以 看 出 ,不 同 的 时 间 序列 具有 不 同 的 特性 。 例 如 , 趋 
向 于 稳定 状态 ,趋向 于 周期 循环 或 出 现 看 起 来 是 毫 无 规律 的 混沌 特征 ,具有 相同 特 
性 的 时 间 序 列 可 能 来 自 于 用 差分 方程 描述 的 非 线 性 系统 ,也 可 能 来 自 于 由 微分 方 
程 描述 的 系统 。 

实际 问题 中 通过 观测 或 实验 手段 获得 的 时 间 序 列 常 常 是 比较 复杂 的 ,在 不 知 
道 实际 系统 解析 模型 的 情况 下 ,分 析 观 测 时 间 序列 的 演变 规律 是 掌握 所 研究 系统 
动力 学 特性 的 重要 手段 。 


1.3 研究 非 线性 时 间 序 列 的 意义 


自 20 世纪 80 年 代 以 来 ,有 相当 多 的 学 者 利用 混沌 、 分 形 等 非 线性 动力 系统 理 
论 来 研究 实际 问题 中 的 复杂 系统 ,并 取得 了 不 少 研究 成 果 。 非 线性 动力 系统 理论 是 
定量 研究 复杂 系统 的 一 种 较 好 的 方法 ,对 于 那些 其 演化 过 程 不 可 预测 但 其 不 可 预 
测 性 可 以 预测 的 复杂 系统 , 即 确定 性 系统 内 具有 内 在 随机 性 的 复杂 系统 ,混沌 理论 
成 为 一 种 有 效 的 研究 工具 。 利 用 非 线 性 动力 系统 理论 研究 复杂 系统 需要 建立 非 线 
性 动力 学 模型 ,但 实际 问题 中 的 复杂 系统 往往 表现 为 多 变量 动态 演化 行为 ,多 层次 
结构 ,由 于 获取 的 信息 通常 是 不 完备 的 ,并 具 不 确定 性 , 且 系统 的 结构 参数 和 边界 
条 件 具 有 时 变性 和 复杂 性 ,因此 往往 难以 直接 建立 起 精确 的 解析 形式 的 数学 模型 ， 
常常 依赖 于 通过 观测 或 实验 手段 获取 的 时 间 序 列 进行 分 析 。 

如 果 通 过 观测 或 实验 手段 获得 的 时 间 序列 是 来 自 于 线性 系统 , 则 时 间 序 列 可 
表示 成 不 同 幅度 的 正弦 波 的 县 加 ,因此 可 用 传统 的 线性 方法 和 Fourier 变换 方法 
进行 处 理 。 但 当 获得 的 时 间 序 列 来 自 于 非 线性 系统 时 ,无 论 多 么 高 阶 次 的 线性 模型 
都 不 可 能 对 该 非 线性 系统 的 行为 做 出 恰当 的 解释 ;相反 ,一 个 低 阶 非 线性 模型 或 许 
能 很 好 地 刻画 该 动力 系统 ,对 这 样 的 时 间 序 列 , 非 线性 时 间 序列 分 析 方法 成 为 重要 
的 研究 工具 。 

经 典 的 时 间 序列 分 析 方 法 是 把 时 间 序 列 看 成 随机 过 程 进行 研究 的 ,因而 整个 
理论 是 以 随机 过 程 作为 基础 的 . 随 着 混沌 现象 的 发 现 ,人 们 发 现在 确定 性 系统 内 部 
也 存在 随机 性 ,但 这 种 复杂 系统 的 本 质 特征 往往 不 是 随机 因素 而 是 非 线性 动力 系 
统 中 的 混沌 因素 造成 的 ,对 从 这 样 的 系统 获取 的 时 间 序 列 , 用 随机 过 程 方法 分 析 显 
然 是 不 合适 的 ,而 应 当 用 混沌 时 间 序 列 分 析 方法 进行 研究 。 

混沌 运动 与 牛顿 力学 中 运动 的 三 种 定常 状态 (静止 ,周期 运动 和 准 周期 运动 ) 
不 同 , 它 是 一 种 始终 限于 有 限 区 域 . 轨 道 永 不 重复 ,性 态 复杂 的 运动 , 它 具 有 对 初 值 
的 极端 敏感 性 \ 长 期 不 可 预测 性 及 分 形 结 构 等 特点 , 它 的 时 间 历 程 是 非 周期 的 或 被 
认为 是 周期 无 穷 大 的 ,貌似 随机 的 运动 曲线 。 混 沌 运动 不 是 随机 运动 ,而 是 属于 确 
定性 运动 的 范畴 ,因为 它 是 源 于 确定 性 系统 ,受到 确定 性 激励 ,因而 反映 了 确定 性 
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系统 的 内 在 随机 性 。 如 果 一 个 时 间 序列 是 由 一 个 确定 性 系统 通过 观测 或 实验 手段 
获得 的 ,要 考虑 的 是 以 下 反问 题 :如 何 由 时 间 序 列 来 恢复 并 刻画 原 复杂 系统 ? 非 线 
性 时 间 序 列 分 析 就 是 研究 如 何 通过 复杂 系统 的 观测 或 实验 获得 的 时 间 序 列 来 辨识 
和 重 构 原 复杂 系统 ,分 析 原 复杂 系统 的 性 质 ,刻画 原 复 杂 系 统 的 特征 ,并 对 原 复杂 
系统 进行 预测 和 控制 .因此 ,研究 非 线 性 时 间 序 列 分 析 方 法 对 解决 实际 问题 中 复杂 
系统 的 相关 问题 具有 重要 的 意义 。 
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非 线性 时 间 序 列 分 析 方法 的 研究 对 象 是 未 知 数学 模型 或 无 法 建立 解析 数学 模 
型 的 复杂 系统 ,研究 过 程 中 具有 的 信息 是 从 复杂 系统 中 通过 观测 或 实验 手段 获得 
的 单 变量 或 多 变量 时 间 序列 。 研 究 目标 就 是 寻求 反映 复杂 系统 本 质 特征 的 不 变量 ， 
分 析 复 杂 系 统 的 特征 ,内 在 变化 规律 及 内 部 关系 ,最 终 解释 、 指 导 甚至 控制 实际 问 
题 中 具体 的 复杂 系统 。 


2.1 非 线 性 时 间 序 列 分 析 流 程 


非 线性 时 间 序 列 分 析 可 以 看 作 是 如 图 2. 1 所 示 的 输入 输出 过 程 ,输入 的 是 没 
有 任何 背景 知识 的 通过 观测 或 实验 手段 获得 的 实际 复杂 系统 的 时 间 序 列 , 输 出 的 
是 所 研究 系统 的 某 些 特征 。 


观测 或 实验 获 “输入 “| 非 线性 时 间 序 | 输出 。 所 研究 系统 
得 的 时 间 序列 列 分 析 方法 的 某 些 特征 


图 2.1 非 线 性 时 间 序列 分 析 的 框架 模型 


为 了 具体 说 明 如 何 从 所 研究 的 系统 获得 的 非 线 性 时 间 序 列 出 发 去 研究 系统 的 
特征 ,下 面 通过 两 个 例子 来 引出 非 线性 时 间 序 列 分 析 的 相 空 间 重 构思 想 。 
例 2.1 考虑 以 下 Henon 映射 


— 2 
Toy. =1— 1.420 + o». (2.1) 
Ynti = 0 3x, 
该 系统 虽然 有 两 个 状态 变量 zx,,y,, 但 由 于 
Zayi = 1 — 1.42% 0.3244 (2.2) 


表明 该 系统 实际 上 只 与 状态 变量 r, 的 前 两 个 时 刻 的 状态 有 关 , 因 此 ,如 果 未 知 该 
系统 的 数学 模型 , 且 只 观测 到 状态 变量 r, 的 有 关 信 息 , 我 们 也 可 以 从 状态 变量 r 
来 建立 原 系统 的 模型 。 对 状态 变量 zx. 进行 相 空间 重 构 , 即 令 
Xn = (Tas Tn) (2.3) 
从 而 
a.a GG) = GG xa) = 1 — 1.425 0.344 (2.4) 
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也 就 是 说 ,只 要 能 找到 函数 G, 就 可 以 从 观测 时 间 序列 {z.} 重 构 原 来 的 系统 。 
例 2.2 考虑 以 下 Lorenz 系统 


& 66-2 
i rr 2) —y (2.5) 
— 
其 中 
o=10,r= 28, 0- $ 


Hew x — 15. 34 
HK h=0. 04, fF RF 
图 


13. 68,2,—37. 91 ,利用 四 阶 Runge-Kute 法 积分 ,积分 
态 变量 z,y,z 的 长 为 2000 的 时 间 序 列 , 从 而 可 以 画 出 如 
2 所 示 的 Lorenz 吸引 子 。 另 外, 如果 我 们 不 知道 该 系统 的 数学 模型 ,只 观测 到 
lit x 的 时 间 序 列 zx,, 对 状态 变量 zx, 进行 相 空 间 重 构 , 令 

Xp = (Say Tums Tena) (2.6) 
从 而 可 得 如 图 2.3 所 示 的 Lorenz 吸引 子 的 重 构图 。 由 图 2.3 可 以 看 出 ,实际 
Lorenz 吸引 子 与 重 构 的 Lorenz 吸引 子 非常 类 似 。 
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图 2.2 Lorenz 吸引 子 图 2. 3 Lorenz 吸引 子 按 (z,,z,-*yz,-s) 重 构 的 相 图 


上 面 两 个 例子 中 的 系统 都 具有 混沌 特征 ,产生 的 时 间 序 列 是 混沌 时 间 序列 , 例 
子 中 的 相 空间 重 构 就 是 混沌 时 间 序 列 分 析 的 基础 。 相 空间 重 构 的 基本 原理 是 
F. Takens" fll R. Mane 中 的 延迟 嵌入 定理 , 它 建立 了 观测 信号 系统 时 间 波 动 和 动 
统 空间 特征 之 间 的 桥梁 。 
单 变量 混沌 时 间 序 列 分 析 的 基本 思想 可 以 描述 如 下 : 
对 未 知 数学 模型 的 混沌 动力 系统 ,通过 观测 或 实验 手段 可 以 获得 单 变量 时 间 
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序列 {z,} ,做 以 下 相 空间 重 构 


X, = (Tas Laney Ta (ni) (2.7) 
从 而 形成 m 维 状态 空间 ,在 重 构 的 m 维 状态 空间 中 可 以 建立 数学 模型 
Xap = GG, (2.8) 


F. Takens 和 R. Mane 证 明了 只 要 适当 选取 m 和 r, 原 未 知 数学 模型 的 混沌 动力 
系统 的 几何 特征 与 重 构 的 m 维 状态 空间 的 几何 特征 是 等 价 的 ,它们 具有 相同 的 拓 
扑 结构 ,这 意味 着 原 未 知 数学 模型 的 混沌 动力 系统 中 的 任何 微分 或 拓扑 不 变量 可 
以 在 重 构 的 状态 空间 中 计算 ,并 且 可 以 通过 在 重 构 的 m 维 状态 空间 中 建立 数学 模 
型 对 原 未 知 数学 模型 的 动力 系统 进行 预测 ,进一步 解释 、 分 析 、 指 导 原 未 知 数学 模 


型 的 动力 系统 。 这 一 过 程 可 以 用 图 2.4 表示 。 
未 知 数学 模型 的 混 导 找 特征 量 ， 建 立 数学 模型 ， 
bs lad 进行 非 线性 预测 竺 
适当 选取 和 r， 
形成 几 维 状态 空间 


观测 或 实验 


单 变量 时 fj 
序列 {x} 


相 空 间 重 构 


图 2.4 单 变量 混沌 时 间 序 列 分 析 流 程 图 


例 2.1 和 例 2. 2 中 的 时 间 序 列 就 是 系统 的 一 个 状态 变量 的 观测 值 ,没有 观测 
噪声 ,而 且 已 知 原 系统 是 混沌 的 ,但 实际 问题 中 复杂 系统 通过 观测 或 实验 手段 获得 
的 时 间 序 列 往往 没有 这 么 理想 ,因此 进行 时 间 序列 分 析 时 还 有 许多 工作 需要 做 。 

对 实际 问题 中 未 知 数学 模型 或 无 法 建立 解析 数学 模型 的 复杂 系统 ,通过 观测 
或 实验 手段 获得 的 时 间 序 列 可 能 是 不 平稳 的 ,可 以 通过 适当 的 方法 对 时 间 序 列 进 
行 平稳 化 处 理 ,因为 混沌 时 间 序 列 分 析 方法 主要 是 针对 平稳 时 间 序 列 的 。 同 时 , 需 
要 对 通过 观测 或 实验 手段 获得 的 时 间 序 列 进行 非 线性 检验 ,如 果 时 间 序 列 是 来 自 
于 线性 系统 , 则 可 以 通过 线性 方法 对 原 系统 进行 建 模 ;如 果 时 间 序 列 来 自 于 非 线性 
系统 ,需要 继续 检验 其 是 来 自 于 确定 性 系统 还 是 来 自 于 随机 系统 ,对 随机 时 间 序 列 
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可 以 通过 统计 方法 研究 ,对 来 自 确定 性 系统 的 时 间 序 列 ,还 需要 进一步 判断 其 是 否 
具有 混沌 特征 ,因为 对 混沌 时 间 序 列 只 能 进行 短期 分 析 , 其 长 期 演化 行为 无 法 正确 
描述 。 另 外 ,通过 观测 或 实验 手段 获得 的 时 间 序 列 往往 具有 噪声 ,在 进行 分 析 处 理 
前 需要 进行 降 品 处 理 。 在 上 述 分 析 的 基础 上 ,可 以 对 时 间 序 列 进行 相 空 间 重 构 ,并 
在 重 构 的 相 空间 中 建立 数学 模型 来 分 析 原 系统 的 演化 行为 。 

因此 ,通过 观测 或 实验 手段 获得 的 时 间 序 列 的 分 析 流程 可 以 用 图 2. 5 表示 。 


实际 问题 中 的 复杂 系统 


观测 或 实验 


单 变量 或 多 变量 时 间 序列 


TEE] 


mXGH 


REO REG 


计算 非 线性 几何 不 
变量 、 非 线性 预测 


图 2.5 通过 观测 或 实验 手段 获得 时 间 序列 的 分 析 流程 图 
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非 线性 时 间 序 列 分 析 的 一 个 缺陷 是 从 输出 的 结果 即 所 研究 系统 的 某 些 特征 本 
身 无 法 给 出 系统 的 实际 意义 解释 ,无 法 从 这 一 过 程 获得 系统 的 某 些 方面 的 改变 对 
系统 的 影响 ,而 通过 建立 系统 数学 模型 研究 系统 行为 的 正 向 研究 方法 恰恰 能 做 到 
这 一 点 。 但 这 并 不 妨碍 对 非 线 性 时 间 序列 分 析 方法 的 研究 ,因为 在 实际 应 用 中 经 常 
是 把 正 向 的 模型 研究 与 反 向 的 时 间 序 列 分 析 结 合 起 来 ,根据 实际 系统 的 背景 知识 
建立 的 正 向 模型 可 以 给 出 系统 的 测量 时 间 序 列 的 特征 ,而 通过 对 观测 或 实验 手段 
获取 的 时 间 序 列 的 分 析 可 以 检验 和 定量 分 析 这 些 特征 ,同时 非 线性 时 间 序列 分 析 
可 以 给 出 什么 样 的 方程 或 模型 适合 所 研究 系统 的 相关 信息 ,为 建立 系统 动力 学 模 
型 提供 建议 和 参考 .另外 ,也 可 以 通过 对 已 建立 的 系统 动力 学 模型 和 非 线 性 时 间 序 
列 的 预测 正确 程度 的 比较 ,分 析 已 建立 的 系统 动力 学 模型 的 精确 性 ,为 进一步 修正 
系统 动力 学 模型 提供 依据 。 


2.2 相 空 间 重 构 


根据 观测 或 实验 手段 获得 的 混沌 时 间 序列 去 研究 复杂 系统 这 种 方法 的 基础 是 
相 空 间 重 构 , 它 的 基本 思想 是 :由 于 混沌 系统 产生 的 轨迹 经 过 一 定时 期 的 变化 后 ， 
会 最 终 做 一 种 有 规律 的 运动 ,产生 一 种 规则 的 有 形 的 轨迹 (混沌 吸引 子 )。 系 统 中 
任 一 分 量 的 演化 都 是 由 与 之 相互 作用 的 其 他 分 量 所 决定 的 ,因此 这 些 相关 分 量 的 
信息 就 隐 含 在 任 一 分 量 的 发 展 过 程 中 ,这 样 就 可 以 从 某 一 分 量 的 时 间 序 列 中 提取 
和 恢复 出 动力 系统 原来 的 规律 。 为 了 重 构 一 个 等 价 的 状态 空间 ,只 需 考察 一 个 分 
基 , 并 将 它 在 某 些 固定 的 时 间 延 迟 点 上 的 观测 量 作为 新 维 处 理 , 即 延迟 值 被 看 作 是 
新 的 坐标 ,它们 确定 了 某 个 多 维 状态 空间 中 的 一 点 .重复 这 一 过 程 并 测量 相对 于 不 
同时 间 的 各 延迟 量 , 就 可 以 产生 出 许多 这 样 的 点 ,已 经 证 明 它 可 以 将 吸引 子 的 许多 
性 质保 存 下 来 , 即 用 系统 的 一 个 观测 量 可 以 重 构 出 原动力 系统 的 模型 ,并 可 初步 确 
定 该 系统 的 真实 相 空 间 的 维 数 。 由 此 可 见 , 相 空间 重 构 就 是 从 时 间 序 列 出 发 创建 一 
个 多 维 状 态 空间 , 它 保持 了 原 系统 的 许多 几何 不 变量 不 变 , 这 些 几 何不 变量 包括 不 
动 点 的 特征 值 \ 吸 引子 的 分 维 数 和 轨 线 的 Lyapunov 指数 等 。 相 空间 重 构 的 依据 是 
F. Takens") 和 R. Mane/?ff E3R lc A EM, F. Takens 的 论文 对 非 数 学 专业 的 人 来 
说 很 难 读 懂 ,R. Mane 的 论文 写 得 更 抽象 ,但 可 通过 下 面 的 相 空间 重 构 过 程 来 理解 
F. Takens 和 R. Mane 的 延迟 嵌入 定理 。 

设 动力 系统 是 由 非 线 性 差分 方程 

Zayi FG (2.9) 

表示 的 离散 系统 ,或 是 由 微分 方程 


dz) _ 
"ab F(z(t)) (2.10) 
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表示 的 连续 系统 。 其 中 z 或 z(2) 是 系统 在 时 刻 或 :的 状态 向 量 ,F(。 ) 是 向 量 值 
函数 。 时 间 序 列 {x,) 是 观测 到 的 系统 某 一 维 输出 , 即 
Ip = h(z,) + wo (2.1) 
或 
En = X(to + nAt) 一 大 [z(te + nat) ]+ wn (2.12) 
RH, h(，) 为 多 元 数量 值 函 数 ;w 为 在 观测 或 者 测量 过 程 中 由 于 技术 手段 不 完善 
或 者 精度 不 够 引起 的 测量 噪声 。 
根据 F. Takens 的 定理 口 , 当 «,— 0 时 ,观察 到 的 时 间 序 列 {z,} 以 向 量 
X, = (Eny Ta-r9 Xam) (2.13) 
形成 m 维 空间 ,只 要 mm 过 24 十 1, 动 力 系统 的 几何 结构 可 以 完全 打开 ,其 中 4 是 系 
统 中 吸引 子 的 维 数 ,r 是 正 整 数 , 称 为 延迟 时 间 间 隔 。 条 件 m 宇 24 十 1 是 动力 系统 重 
构 的 充分 但 不 必要 条 件 ,获得 动力 系统 重 构 的 整数 m 叫做 嵌入 维 数 。 状 态 空间 中 
x 一 xn+1 的 演化 反映 了 未 知 动力 系统 2 一 zo+1 或 z(t) 一 z(t 十 1) 的 演化 ,并 且 状 态 空 
间 R” 中 吸引 子 的 几何 特征 与 原动力 系统 的 几何 特征 等 价 ,这 意味 着 原动力 系统 
中 任何 微分 或 拓扑 不 变量 可 以 在 重 构 的 状态 空间 中 计算 。F. Takens 的 定理 是 在 
无 噪声 的 情况 下 考虑 的 , 即 式 (2. 11) 和 式 (2. 12) 中 的 w 一 0, 后 来 T. Sauer 等 把 延 
迟 嵌 入 定理 推广 到 了 具有 噪声 的 情形 中 。 
对 一 组 长 为 N 的 实测 时 间 序 列 {zo} 六 ,由 式 (2. 13) 可 构造 出 m 维 状态 向 量 
x. = (EnEn Enim) E R", n= NeNod.aesN (2.14) 
其 中 No= (m 一 1)r 十 1,r 是 延迟 时 间 间 隔 。 在 R" 中 以 Le R LÁ ETAGE x F) x, 


的 距离 , 即 
- 
lx — x; lam JS Gee — zd (2.15) 
名 


lx, — x, ls = max ,|zire — Tireel (2.16) 


以 下 在 不 特别 说 明 的 情况 下 , 记 R 中 的 范 数 为 | 。 | ,但 工 - 范 数 在 计算 距离 时 
实现 较 快 。 

为 了 能 在 重 构 的 R7 空间 中 刻画 原动力 系统 的 性 质 , 需 正确 地 确定 延迟 时 间 
间隔 r RAER m。 


2.2.1 延迟 时 间 间 隔 的 确定 


由 F. Takens 的 延迟 代 入 定理 知 , 在 时 间 序 列 无 限 长 ,无 噪声 .无限 精确 的 情 
况 下 ,可 以 任意 选择 ,但 实测 时 间 序 列 是 有 限 长 的 , 且 一 般 都 有 噪声 污染 和 测量 
误差 ,只 能 根据 经 验 来 选择 c, 选择 c 的 基本 思想 是 使 zx, 与 z+: 具 有 某 种 程度 的 独 


或 
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立 但 又 不 完全 无 关 ,以 便 它 们 能 在 重 构 的 相 空间 中 作为 独立 的 坐标 处 理 。 如 果 z 太 
小 , 则 x, 与 za+: 的 值 充分 僻 近 ,以 至 于 不 能 区 分 它们 ,从 实际 观点 看 不 能 提供 两 个 
独立 的 坐标 ,导致 吸引 子 重 构 非 常 舍 近 相 空间 中 的 “对 角 线 ”, 重 构 的 相 空间 可 能 总 
是 杂乱 无 规则 的 ;如 果 AXX. r 与 zs+* 可 能 会 不 相关 ,吸引 子 轨 道 会 投影 在 两 个 
完全 不 相关 的 方向 上 ,不 能 反映 相 空间 中 轨 线 的 真实 演化 规则 。 鉴 于 此 ,需要 选择 
一 个 比较 合适 的 延迟 时 间 间 隔 *。 目 前 ,可 以 使 用 的 方法 非常 多 ,但 从 计算 复杂 性 
和 使 用 的 简便 性 等 角度 看 ,比较 常用 的 方法 主要 有 自 相关 函数 法 和 平均 互信 息 法 。 


1， 自 相关 函数 法 


自 相关 函数 的 基本 思想 是 要 考察 观测 量 x 和 zx,+: 与 平均 观测 量 的 差 之 间 的 线 
性 相关 性 , 即 如 果 假 设 


Xe — T = Cu), — x) (2.17) 
其 中 
—— (2.18) 
Na 
则 使 
N - = 
D Lrs — T — Cie) — z) ]? (2.19) 
z 
最 小 的 Ci(7) 为 
N 
PD) (a, — 2) 
Cie) = Sy — (2. 20) 
Dln- z) 


— 


称 这 样 的 Cr(r) 为 线性 自 相 关 函 数 。 取 Cz(r) 第 一 次 为 零 时 的 c 为 延迟 时 间 间 隔 ， 
此 时 在 平均 意义 下 ,z, 和 r ERER, 

自 相关 函数 法 是 比较 简单 的 寻找 时 间 延 迟 + 的 一 种 方法 ,但 这 种 方法 只 考虑 
到 时 间 序 列 中 线性 关系 ,至 于 非 线 性 关系 并 不 清楚 ,所 以 并 不 适合 所 有 情况 。 特 别 
当 自 相关 函数 变化 十 分 缓慢 时 ,选择 r 会 非常 困难 。 


2. 平均 互信 息 法 


不 同 于 自 相关 函数 法 ,平均 互信 息 法 将 非 线 性 关系 也 考虑 在 内 ,这 种 方法 的 根 
据 是 可 从 事件 5 在 集 B 中 发 生 的 概率 中 得 到 关于 a, ERA 发 生 概 率 的 信息 。 文 
献 L[5，6] 给 出 了 平均 互信 息 的 定义 以 及 如 何 从 时 间 序 列 计算 平均 互信 息 的 方法 。 
设 观测 时 间 序 列 为 {z*}, 则 在 > A ntr 时 刻 观 测量 之 间 的 平均 互信 息 为 


> P( x, zc) 
I(r) = DP laze log Pe SPE | (2.21) 
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RP, PGOPGAí D Pln nt) HER. 

概率 PG) P Gua D 8L ALE ih SAY [S] FE 080 RG KA R 已 Czv， 
x+r) 可 以 通过 计算 时 间 序列 的 二 维 直方 图 获得 , 利用 计算 机 可 以 很 方便 地 计算 观 
ist Ta) FE P 85 7-35) A (960 . 

文献 [5] 建 议 选择 T(r) 的 第 一 个 局 部 最 小 时 的 + 为 延迟 时 间 间 隔 , 因 为 此 时 产 
生 的 宛 余 最 小 ,产生 了 最 大 的 独立 性 。 与 自 相关 函数 法 相 比 ,平均 互 信息 法 考虑 了 
非 线 性 依赖 性 ,但 仍 有 其 局 限 性 ,如 有 时 可 能 无 局 部 最 小 或 对 某 些 例子 特别 不 合 
ja" 8, 

除了 自 相 关 函 数 法 和 平均 互信 息 法 外 ,选择 + 的 方法 还 有 重 构 展 开 法 中 、 高 阶 
关联 法 四 、 通 过 分 析 整体 和 局 部 混沌 吸引 子 行为 获得 优化 延迟 时 间 的 填充 因子 
法 中 等 多 种 方法 ,这 些 方法 都 有 各 自 的 特点 ,但 实际 应 用 中 用 得 较 多 的 还 是 自 相 
关 函 数 法 和 平均 互信 息 法 。 


2.2.2 WA HET URGE 


关于 嵌入 维 数 ,F. Takens'?, R. Mane, T. Sauer 4$ 56 Jai JA X iE EWE T 24 
m>2d+1 时 可 获得 一 个 吸引 子 的 嵌入 ,其 中 以 是 吸引 子 的 分 形 维 数 , 但 这 只 是 一 
个 充分 条 件 ,对 观测 时 间 序 列 选择 m 没有 帮助 。 如 果 仅 仅 是 计算 关联 维 数 ， 
M. Z. Ding 等 5 证 明了 对 无 噪声 ,无 限 长 的 时 间 序列 ,只 要 取 m 为 大 于 关联 维 数 d 
的 最 小 整数 即 可 ,但 对 长 度 有 限 且 具 噪 声 的 时 间 序 列 ,m 要 比 d 大 得 多 。 WMR m i 
得 太 小 , 则 吸引 子 可 能 折 公 以致 在 某 些 地 方 自 相交 ,这 样 在 相交 区 域 的 一 个 小 邻 域 
内 可 能 会 包含 来 自 吸引 子 不同 部 分 的 点 ;如 果 m 选 得 太 大 ,理论 上 是 可 以 的 ,但 在 
实际 应 用 中 , 随 着 m 的 增加 会 大 大 增加 吸引 子 几 何不 变量 (如 关联 维 数 .Lyapunov 
指数 等 ) 的 计算 工作 量 , 且 噪声 和 舍 入 误差 的 影响 会 大 大 增加 。 

在 实际 应 用 中 常 有 以 下 方法 选取 嵌入 维 数 mm。 


1. RHR 


试 算法 是 通过 逐步 增加 计算 过 程 中 的 嵌入 维 数 ,观察 什么 时 候 某 些 几 何不 变 
量 (例如 ,关联 积分 .关联 维 数 .Lyapunov 指数 等 ) 停 止 变化 的 方法 .从 理论 上 讲 , 由 
于 这 些 几 何不 变量 是 吸引 子 的 几何 性 质 , 当 m 大 于 最 小 傍 入 维 数 时 ,几何 结构 被 
完全 打开 ,因此 这 些 不 变量 与 幅 入 维 数 无 关 , 取 吸引 子 的 几何 不 变量 停止 变化 时 的 
m ASR A FERC, ORR TRAY k JE Ot BE OR BE EMR) ,计算 量 大 上 且 比 
较 主 观 。 例 如 ,P. Grassberger 通过 增加 嵌入 维 数 m ,计算 关联 积分 Cu Grm 0, 
当 关联 积分 Cy(r,m,r) 不 再 变化 时 的 m kA ERO”, 


2. 虚假 邻 点 法 


虚假 邻 点 法 建立 在 以 下 事实 的 基础 上 :选择 太 小 的 嵌入 维 数 将 导致 那些 在 原 
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相 空间 中 离 得 比较 远 的 点 会 在 重 构 的 相 空间 中 靠近 。 其 基本 思想 是 当 嵌 入 维 数 从 
m BEB m+ 1 时 ,考察 轨 线 x, 的 邻 点 中 哪些 是 真实 的 邻 点 ,哪些 是 虚假 的 邻 点 , 当 
没有 虚假 邻 点 时 ,可 以 认为 几何 结构 被 完全 打开 D9。 

设 x, 的 最 近邻 点 为 Xr B 


Ig 


i — = i X. X, 
ll xw — x, — LI ja 


mt 
2) Groves — Enpi) ? (2. 22) 
fi 

HAER m 增加 到 m 4-1 时 ,它们 之 间 的 距离 变 为 


I yc — x, |f? = p| D Gre — tate)? 


= VI h te — x dE PT Unos — nun (2.23) 
BEM ayes te] HP EET LES E TAADA A FD 
不 相 邻 的 点 在 投影 到 低 维 轨 线 上 时 变 成 相 邻 的 两 点 造成 的 ,因此 这 样 的 邻 点 是 虚 
假 的 。 具 体 地 说 , 当 
J Lae — 5 EOF = Dre nF zw — zu 
| 


> 
| xso — x, ll hr? |? | x» — x, | £^? 2 Ra 
T 2 


(2. 24) 
时 ,xrw 为 x, 的 虚假 最 近邻 点 ,其 中 Ru 是 某 一 个 阔 值 ,文献 [13] 建 议 Ru 之 10, 而 
文献 [14] 建 议 Ru 可 取 15 左右 。 
观测 时 间 序 列 通常 具有 噪声 且 长 度 有 限 , 所 以 仅仅 用 上 面 的 标准 判别 虚假 最 
近邻 点 会 不 正确 ,为 此 ,M. B. Kennel 等 提出 了 增加 以 下 标准 , 即 当 
ll ror = xdg =e m E > An (2. 25) 
JNXl^- 3277] 
Ff 5 ye 29 x, 的 虚假 最 近邻 点 ,其 中 4u 是 阔 值 ,文献 [13] 建 议 A — 2. 
对 式 (2.14) 中 的 每 个 x,, 按 式 (2.22) 找 出 其 最 近邻 点 ,并 按照 式 (2. 24)、 式 
(2. 25) 的 标准 判别 最 近邻 点 是 否 是 虚假 的 ,从 而 可 以 计算 出 虚假 最 近邻 点 的 比例 。 
让 m 从 1 开始 增加 ,计算 每 个 m 时 的 虚假 最 近邻 点 的 比例 ,直到 虚假 最 近邻 点 的 
比例 小 于 5% 或 虚假 最 近邻 点 不 再 随 着 m 的 增加 而 减少 时 ,可 以 认为 吸引 子 几 何 
结构 完全 打开 ,此 时 的 m RA BER. 
从 几何 观点 看 ,这 是 一 种 较 好 的 方法 ,但 在 判断 虚假 邻 点 时 赣 值 的 不 同 选取 会 


导致 不 同 的 结果 ,因此 具有 较 大 的 主观 性 。 从 式 (2. 24) 看 , 阔 值 应 当 由 时 间 序 列 的 
方差 确定 ,因此 ,不 同 的 时 间 序 列 有 不 同 的 阔 值 ,这 意 昧 着 要 给 出 一 个 合适 和 合理 
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的 阔 值 是 非常 困难 的 甚至 是 不 可 能 的 ,为 此 ,文献 [15] 提 出 了 改进 的 虚假 邻 点 
算法 。 


3. 改进 的 庶 假 邻 点 法 
对 式 (2. 14) 中 的 x,, 类 似 于 虚假 最 近邻 点 法 的 思想 ,文献 [15] 定 义 


f xs — x, l| St? 
alnm) =- pm = el * (2. 26) 


这 里 用 的 是 LR CHA an m) XT n 的 均值 为 


oti fm 
Em) = FON, F 122400 (2.27) 


n=Ny 


由 于 式 (2. 14) 的 相 空间 重 构 方 式 与 文献 [15] 中 有 所 差别 , 式 (2. 14) 是 向 后 重 
构 , 而 文献 [15] 中 的 重 构 是 向 前 重 构 , 所 以 式 (2. 27) 与 文献 [15] 有 所 不 同 , 但 本 质 
上 是 一 样 的 。 

E On) FARR HA ERE m 和 延迟 时 间 间 隔 r, 为 了 研究 嵌入 维 数 从 m 变 为 
妈 十 1 时 相 空 间 的 变化 情况 ,定义 


E\(m) = E(m +1) 


E(m) 
如 果 当 m KEKE mo BS E Gn) PEALE E «SU mo 十 1 BR A E H A 28 E B9 Re /] A 
HEROS, 

对 来 自 于 随机 系统 的 时 间 序 列 , 原 则 上 , 随 着 m 的 增加 ,ECm) 将 水 远 不 会 达 
到 饱和 值 , 但 在 实际 计算 中 , 当 m 充分 大 时 ,很 难 分 辨 E, (m) 是 在 缓慢 增加 还 是 停 
止 变化 。 事 实 上 ,由 于 获得 的 观测 时 间 序 列 是 有 限 长 的 ,可 能 会 出 现 虽然 是 随机 时 
间 序 列 ,但 Ey Gn) Be EXE — m 处 停止 变化 。 为 了 解决 这 一 问题 ,文献 [15] 定 义 了 量 


(2. 28) 


N 
. * — = 
E'm) = FN, 3 12; zx,» (2. 29) 
id 
Eon = PED (2.30) 


对 随机 时 间 序 列 , 由 于 将 来 的 值 与 过 去 的 值 独立 ,对 任何 m E; n YEAST 1, 而 对 
确定 性 系统 的 观测 时 间 序 列 ,E.(m) 显 然 与 m 有 关 , 对 所 有 m, En (om) BAY AE HE 
数 .因此 ,文献 [15] 建 议 可 以 通过 同时 计算 E,(m) 和 ,Cm) 来 确定 时 间 序 列 相 空间 
重 构 的 最 小 嵌入 维 数 ,同时 也 区 分 了 时 间 序 列 是 来 自 于 确定 性 系统 还 是 随机 系统 。 

除了 上 述 方法 外 ,确定 嵌入 维 数 的 方法 还 有 关联 积分 法 59 奇异 值 分 解法 57 
以 及 上 述 各 种 的 改进 方法 。 
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2.3 几何 不 变量 的 计算 


对 实际 问题 中 具有 混沌 特征 的 复杂 系统 ,通常 可 以 通过 一 些 几 何不 变量 ( 例 
如 ,分 形 维 数 .Kolmogorov #4 #l Lyapunov 指数 等 ) 来 定量 刻画 该 系统 的 复杂 程 
度 ,因此 如 何 从 观测 或 实验 手段 获得 的 时 间 序 列 去 计算 复杂 系统 的 这 些 几 何不 变 
量 是 实际 应 用 时 所 关心 的 问题 。 复 杂 系 统 的 吸引 子 具 有 分 数 维 数 、 正 的 
Kolmogorov fi LA X ER] SX: Lyapunov 指数 是 判断 系统 是 混沌 的 必要 条 件 , 但 并 
不 充分 。 分 形 维 数 的 定义 有 很 多 种 ,从 时 间 序 列 的 角度 看 ,关联 维 数 是 易于 计算 的 
一 种 分 形 维 数 。1983 年 ,P. Grassberger 和 I. Procaccia 提出 了 从 时 间 序 列 中 计算 
关联 维 数 的 G-P York 四 以 及 计算 Kolmogorov Aft] AHO”, CC AEWUR KE 
杂 性 程度 的 一 种 很 好 的 度量 ,一 般 认为 ,大 于 关联 维 数 的 下 一 个 整数 是 刻画 系统 所 
需 的 独立 变量 的 个 数 , 这 为 从 时 间 序 列 恢复 原 复杂 系统 确定 了 一 个 框架 。 
Lyapunov 指数 度量 了 复杂 系统 的 预测 性 ,定量 地 刻画 了 初始 靠近 的 状态 空间 轨 线 的 
指数 发 散 率 , 从 时 间 序 列 中 计算 最 大 Lyapunov 指数 的 最 早 工作 是 于 1985 年 由 
A. Wolf 等 提出 的 轨 线 法 C) 。 


2.3.1 关联 维 数 


相 空 间 的 最 小 嵌入 维 数 m 是 系统 复杂 性 的 一 个 界 ,这 种 拓扑 维 数 在 一 般 情况 
下 只 是 吸引 子 占据 空间 数量 的 一 个 非常 粗糙 的 描述 ,为 了 给 出 更 严格 的 描述 ,文献 
[21 一 23] 引 入 了 几 种 不 同 的 维 数 概念 ,其 中 关联 维 数 是 最 常用 的 一 种 维 数 度量 ,万 
其 对 通过 观测 或 实验 获得 的 时 间 序 列 , 可 由 P. Grassberger 和 I. Procaccia 给 出 的 
G-P 算法 直接 计算 0* 中 。 关 联 维 数 度量 了 所 研究 系统 的 复杂 性 ,刻画 了 相 空 间 中 
点 的 分 布 。 在 确定 性 系统 中 ,关联 维 数 就 是 生成 相应 复杂 系统 所 必需 的 独立 变量 的 
个 数 , 规 则 的 确定 性 系统 有 整数 关联 维 数 ,而 混沌 系统 有 非 整 数 关 联 维 数 ,大 于 此 
关联 维 数 的 下 一 个 整数 就 是 系统 的 独立 变量 的 个 数 。 但 是 某 些 关联 的 随机 过 程 中 
也 有 非 整数 维 数 C9 ,文献 [25] 证 明了 非 整数 关联 维 数 不 能 成 为 混沌 判断 的 充分 条 
件 , 因 为 分 形 的 Browian 运动 ,虽然 不 是 混沌 的 ,但 也 有 非 整数 关联 维 数 。 

G-P 算法 描述 如 下 :在 按 式 (2.14) 重 构 的 m 维 空间 中 ， Ae = 


xj ||) 表示 除 x; 本 身 外 到 x; 的 距离 小 于 7 的 x; 的 点 数 ,其 中 态 (。) 是 Heavside R 
数 , 即 当 zx<0 时 ,H(z)=0, 当 zx>0 时 ,H(z)=1。 定义 按 上 述 方式 重 构 的 时 间 序 
Diy ne RADA 

2 Nl oN 


CyGr. Tm) = QUNEXN-NG DI PHE- |a hd QG.3D 


TX, ja 


BOE PR EER LEAT +236 


Cnr,r,m) 描 述 了 距离 小 于 + 的 对 点 数 的 分 布 情况 。 如 果 在 7 的 某 一 区 间 段 内 ,有 
Cn(r,t,m)oor* (2. 32) 

则 称 d 是 关联 维 数 ,这 样 定义 的 dB cir AU Ze) P7 ^ RT [B] FE (2) 0 AER RE 
复杂 程度 的 某 种 维 数 。 对 由 观测 或 实验 手段 获得 的 时 间 序 列 , 使 式 (2. 32) LER r 
的 某 一 区 间 段 可 通过 对 双 对 数 InCw(r,r*m)-lnr 图 观测 的 办 法 或 通过 文献 [26] 给 
出 的 方法 寻找 。 

G-P 算法 是 计算 关联 维 数 的 一 种 经 典 方法 ,后 来 又 有 不 少 文献 讨论 了 G-P 算 
法 的 改进 和 其 他 计算 关联 维 数 的 方法 9]。 

由 观测 或 实验 手段 获得 的 时 间 序列 对 应 混沌 系统 的 关联 维 数 就 是 双 对 数 
lnCwn(r,r,m)-lnr 图 的 线性 部 分 的 斜率 ,由 于 连续 采样 点 之 间 的 相关 性 ,会 造成 < 肩 
巍 ? 效 应 ,为 了 消除 这 种 “ 肩 峰 ? 效 应 ,文献 [27] 对 关联 积分 作 了 以 下 修改 , 即 定义 


Cyr msi) = 2 
— — 


N-w 


N 
MN H(r — Ix — xl) (2.33) 


(EN, jr 


3X. 33) P d Bit. f 8X A Z [a] SE SY UR RP PER RUE IE EUR 
li— j| Sw R9 A HEP wel 2/N) "7 EIC we BI Rf, 文献 [27] 指 出 w 的 严格 
选取 并 不 重要 。 

在 实际 应 用 中 ,关联 维 数 的 计算 是 非常 费时 的 ,为 了 改善 前 面 算 法 的 计算 效 
率 , 文 献 [35] 提 出 了 一 种 修改 算法 。 在 关联 积分 中 , 较 短 的 距离 起 着 更 有 意义 的 作 
用 ,因此 选取 x 的 截断 距离 r。, 构 造 宽度 为 r。 的 盒子 网 格 , 只 计算 在 相同 的 或 相 邻 
的 盒子 中 距离 小 于 ro 的 对 点 的 距离 ,这 样 可 以 把 计算 时 间 从 O(N?) 减 到 
OCNlogzN) .文献 [35] 给 出 了 ro 的 一 个 优化 选择 

ro = R(2/N) 4 (2.34) 
式 中 , R 为 时 间 序 列 的 有 效 半径 ; N 为 时 间 序 列 的 长 度 ;d 为 关联 维 数 的 粗略 
估计 。 

当 关联 维 数 的 值 较 大 时 ,所 需 的 时 间 序 列 要 求 较 长 9 ,而 实际 问题 中 ,观测 或 
实验 获得 的 时 间 序 列 一 般 都 比较 短 ,为 解决 这 一 问题 ,文献 [30] 利 用 极 大 似 然 法 估 
计 关 联 维 数 的 方法 就 有 对 数据 要 求 相对 较 少 的 优点 ,其 计算 公式 为 

DH(ro— lxi — xjl)ln(r/ lxi — x; I T 
d= | (2.35) 
DHr Ex — xl) 
用 式 (2. 35) 估 计 a 的 近似 方差 为 


Var(d) = 


2d? 
BON — NOON — No + 1) 


[2eCN — 2) +1] (2. 36) 
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其 中 


p= plilx—x, ll <r} (2. 37) 
Tater din TT 吉之 辣 的 相关 系数 ， ama I< 


RH, 9 为 1 一 dln ix 
ros || xix || <roe 

这 一 方法 的 关键 在 于 ro 的 选取 , 既 不 能 太 小 ,也 不 能 太 大 。 当 ro 较 小 时 ,可 计 
算 的 点 减少 , 则 估计 变 得 不 可 靠 ; 当 ro 较 大 时 ,虽然 可 以 产生 较 稳 定 的 结果 ,但 由 
于 Clr)=(r/ro0)*(0<r<ro) 的 距离 分 布 方差 使 结果 产生 较 大 的 偏差 ,文献 [30] 详 
细 给 出 了 利用 x 一 测试 确定 ro 的 一 种 方法 。 

虽然 许多 研究 者 提供 了 关联 维 数 估计 算法 的 精细 的 数学 分 析 性 质 ,但 这 些 方 
法 如 何在 有 限 长 的 、 可 能 被 噪声 污染 的 、 非 平稳 的 观测 或 实验 时 间 序 列 上 实现 仍 有 
许多 问题 需要 解决 。 


2.3.2 Kolmogorov ffj 90 Renyi 3% 


考察 m ABA E BEER SF ER Gl x G) = Cn GO ns (O0 nm QD) ,把 相 
A: TRAD el AR 3 OX r 的 m 维 超 立方 体 ,每 隔 时 间 At 去 测量 系统 的 状态 , 设 p Gs 
iay…yim) 是 rr 一 At) 在 超 立方 体 中 ,zx(t 一 2At) 在 超 立 方 体 ia x ma 
在 超 立 方 体 iw 中 的 联合 概率 分 布 , 则 Kolmogorov Ay 


K, =— lim lim lim pa, D Pine + sim Mogep Cr sizs yim) (2. 38) 
而 9 Br Renyi HE XA 
K, —— lim lim lim ag jen DP [ORE (2. 39) 
显然 有 
limK, — K, (2. 40) 
ot 


若 类 似 于 关联 积分 ,定义 下 面 的 9 阶 广义 关联 积分 
1 — » Hl j t x 
Chr tym) = lwo gli, i r= læ — x; 
(2.41) 
Jil 9 Br Renyi WAT RAR AS? 


K, —— lim lim lim n log Ck, Dm) (2. 42) 


P. Grassberger 和 1. Procaccia 证 明了 K, 关于 q 是 单调 减少 的 09 ,因而 Ki Koi 
3l q—2 时 ,Ch(r,r,m) 就 是 关联 积分 ,因此 可 由 关联 积分 计算 二 阶 Renyi Hi Ka È 
可 作为 Kolmogorov $ Ki 的 一 个 下 界 。 
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AA TT) FRE EAE — A AE ERE Fy S E SUR SE CAR LG TERRE 
Hi qs SE EAC HY BY ISTE , ORBE TET TER E e T (E RT SCAR 38— 40]. 


2.3.3 Lyapunov 指数 


混沌 动力 系统 有 对 初始 条 件 的 敏感 依赖 性 ,这 意味 着 在 状态 空间 中 无 限 靠近 
的 两 个 向 量 会 产生 两 条 指数 分 离 的 轨 线 , 设 DD 维 混沌 动力 系统 为 
Zarı = FG) (2. 43) 
设 z M 为 DD 维 状态 空间 中 两 个 非常 辕 近 的 状态 , 则 它们 的 分 离 程度 的 
时 间 演 化 为 
Z — uh F(z)-Fí(z) 
= Jnl 2021 — 2821) + OC | 2 — zi? yp?) (2. 44) 
R PFE 2° 处 进行 Taylor RF, J =J. (zn? )J& F TE zi? BERG DX D BT 
Jacobi 矩阵 。 
SRB, =2. —2. 给 定时 ,可 以 计算 一 次 迭代 后 它 的 变化 情况 。 设 e 为 J 
的 特征 向 量 , 对 应 的 特征 值 为 4, 把 $, 以 系数 s 分 解 为 这 些 特征 向 量 的 和 , 即 
ô= >) Be, V8, — 六 BAe 。 特 别 地 ,如 果 6, 平 行 于 某 个 特征 向 量 e, 则 它 以 
4 为 因子 进行 伸展 或 压缩 ,这 样 可 找到 D. 个 不 同 的 局 部 伸展 因子 ,把 状态 空间 分 
解 为 DD 个 线性 子 空间 .显然 ,对 状态 空间 中 任意 其 他 点 ,可 以 找到 Jacobi 矩阵 的 不 
同 特征 值 和 特征 向 量 ,因为 Jacobi 矩阵 本 身 是 依赖 于 位 置 的 。 
为 了 从 整体 上 刻画 系统 ,引入 不 同 局 部 因子 的 一 个 适当 的 平均 , 即 Lyapunov 
指数 ,定义 为 


à = lim inlA” |, G= 1,2, D) (2.45) 
其 中 AM 定义 为 
Tr. uc = AMu™ (2.46) 


DD 个 不 同 的 如 称 为 Lyapunov 指数 谱 ， 其 中 最 大 的 一 个 称 为 最 大 Lyapunov 指数 。 
如 果 最 大 Lyapunov 指数 是 正 的 ,意味 着 相 邻 的 轨 线 按 指数 发 散 , 即 系统 是 混 
沌 的 。 

对 观测 获得 的 混沌 时 间 序 列 , 最 大 Lyapunov 指数 可 由 A. Wolf 等 提出 的 轨 线 
法 计算 “外 ,而 Lyapunov 指数 谱 可 由 J. P. Eckmann 和 R. Brown 等 提出 的 矩阵 法 
计算 cu. 人。 


1. 观测 时 间 序 列 的 最 大 Lyapunov 指数 的 轨 线 计算 法 
1985 年 ,A. Wolf 等 在 文献 [20] 中 提出 了 计算 由 观测 获得 的 混沌 时 间 序 列 的 
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最 大 Lyapunov 指数 的 一 种 方法 。 

步骤 V OSTISEISI FE Cr, Voci LAF SESS BA 

Xn = GnaX.estttsreen-p) E R”, n = 1,2,7,N — Gn — Dr (2.47) 

2592 VULG RR x = Car aiser nee -o0 WHER EAR Un) n 1,2. 
N— Gc PR xi 外 的 其 余 点 中 选取 一 个 与 xs BOTA xs EORR iB Li 
lxx» d. 

步骤 3: 取 一 适当 的 时 间 步 长 或 演化 时 间 T. ,此 时 基点 变 为 x+r ,端点 变 为 
Xn er de Li | xier, anar || WERT, 时 间 演 化 后 ,可 得 指数 增长 率 为 


= Llog, A 
à = Flog: ri (2.48) 


演化 时 间 T, 不 能 太 长 ,否则 有 可 能 因为 吸引 子 整 体 结 构 上 的 折 得 .突变 而 产生 对 
Lyapunov 指数 的 错误 估计 。 

PRAEAN) onm 1,2, N= Qi Dt PBR xir PRO CA e PER — 
M zio, BOE ROS x FECI BE REGE FR AR ELE TIE non non 与 
nor ZMH 0 RTTA Lo ner xl. 

SMES EL — 1 ERAT SE TBE KREET Ta, HERE AE AE xen ern, RU 
HPUH xen, ÌE L= ‖ xir er, — xen, ll AWARE T; 时 间 演 化 后 ,可 得 指数 增 
长 率 为 

A= Ter (2. 49) 

EAR Ux.) mn 一 1,2,…，,N 一 (mm 一 1)r PR xier er P ÉD CAS A PER AG 
zer er BOR UI A x 作为 新 的 端点 进行 向 量 的 替换 , 且 使 向 量 or nane 
xyXier er, Z IBI 3€ f 0; 尽 可 能 小 , 记 Lo ll xier er, 7x ll. 

步 又 6: 重复 上 述 过程 , 直 到 时 间 步 长 或 演化 时 间 到 达 点 集 {x,) 8 — 1,2, 
N 一 lm 一 1)r 的 终点 , 记 演化 的 总 步 数 为 M, 则 取 指 数 增长 率 A 的 平均 值 作为 最 大 
Lyapunov 指数 的 估计 值 , 即 


a= AX Plog: # (2.50) 
步 又 7 MRKA HEC m, 并 重复 上 述 计算 步骤 ,直到 指数 的 估计 值 随 m 保持 
平稳 为 止 ,此 时 得 到 的 计算 结果 即 为 所 求 的 最 大 Lyapunov 指数。 
上 述 过 程 可 用 图 2.6 表示 。 
综 上 可 知 ,为 了 得 到 一 个 好 的 最 大 Lyapunov 指数 的 估计 值 ,必须 要 求 观测 时 
间 序 列 具 有 足够 的 长 度 。 最 大 Lyapunov 指数 的 轨 线 算法 的 一 种 改进 可 见 文 
献 [43]。 


POE PREM EAT UT UD 


基线 


Ayenenen, 


a 


图 2.6 最 大 Lyapunov 指数 的 轨 线 计算 方法 


2. Lyapunov 指数 谱 的 起 阵 计算 法 


Lyapunov 指数 谱 的 矩阵 计算 法 最 初 由 J.P. Eckmann 和 R. Brown 等 在 文献 
[41,42] 中 提出 ,对 一 组 长 为 N 的 实测 时 间 序 列 {z,})*%1, 在 按 式 (2.14) 重 构 的 m 
维 空间 中 ,定义 从 向 量 x, 演化 到 x。+. 的 演化 算 子 为 G= (iG G7 BI 

xn. GG) (2.51) 
写成 分 量 形式 为 
Taped 1,2, m (2.52) 
其 中 自然 数 " 是 演化 时 间 间 隔 。 设 x, 的 最 近邻 点 为 xxw, 则 由 一 阶 Taylor 展开 可 得 
Xie — Xie =G( xs) — Gl x3) 
=G( x] + ( xh» — x:)) — G( x7) 


DG ( xr — x,) 7 (2.53) 
其 中 Jacobi 矩阵 DE X 
9G. BCE 0. 一 
arn On aro-om-Dr 
2G, 3G, . 3G, 
DG” = | ar, dr. [om (2.54) 


3G. 3G. . 3G, 
An, na [uum 


则 由 Oseledec 定理 ,动力 系统 (2. 51) 的 所 有 Lyapunov 指数 为 矩阵 
dim[( DG'^»* o DG ot K-P one DG)  ( DG Mo o pgos*K-P.. DGM) JÆ (2.55) 
的 特征 值 的 对 数 。 
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对 已 知 的 动力 系统 , DG” 可 由 式 (2. 54) 确 定 ,而 对 由 观测 或 实验 获得 的 时 间 
序列 描述 的 未 知 动力 系统 ,可 按 下 面 的 方法 来 确定 DG”. 
当 演化 时 间 间 隔 v 与 延迟 时 间 间 隔 r 一 致 时 ,由 式 (2. 52) X 2. 54) 可 得 


0 1 0 
0 0 = 0 
DG" sm op oc (2. 56) 
a a at 
3G, 
sti, afro Le 11,2, m 为 待定 系数 。 


XE GER 720,35 x, Wr BRAA LO) PSI Ex, 7 x, |] n1. 
2, LO WIS Lnr) >m 时 ,可 由 以 下 最 小 二 乘法 确定 af af enam LED 
找 使 


Ff (af? af? am) 


Lem 


= D [PaP (ra — name) — (zm m9) ] (2.57) 


im cde 


取 最 小 值 的 aP af? v san? , ERIR (2. 53) 的 近似 程度 最 好 。 
当 演 化 时 间 间 隔 v 与 延迟 时 间 间 隔 r 不 一 致 时 


w aw (ny 
an a ct Qim 


(9 qc e qc 
aun an Azm 


pg? = | fm o n (2. 58) 


中 所 有 系数 可 由 最 小 二 乘法 逐 行 来 确定 。 
Lyapunov 指数 谱 矩 阵 算法 的 改进 和 快速 算法 可 见 文 献 [44 一 50] 。 


2.4 观测 时 间 序 列 平稳 性 的 检验 


无 论 是 传统 的 线性 时 间 序 列 分 析 方 法 还 是 最 近 越 来 越 受 到 重视 的 非 线 性 时 间 
序列 分 析 方法 ,都 必须 假设 时 间 序 列 的 某 种 平稳 性 .对 于 通过 观测 或 实验 获得 的 时 
间 序 列 , 如 何 检验 它 是 否 具有 某 种 平稳 性 是 首先 要 解决 的 问题 。 

时 间 序 列 {zw} 亿 : 称 为 平稳 的 , 若 对 所 有 及 连续 函数 h: ROR BA 

二 = lim $ Silents cen (2.59) 


存在 所]。 但 是 通过 观测 或 实验 获得 的 时 间 序列 几乎 不 可 能 满足 这 个 标准 ,为 此 文 
献 [52] 提 出 了 阶 “ 弱 平稳 性 ”概念 , 即 n 阶 矩 关于 时 间 不 变 。 文 献 L[53] 说 明 二 阶 平 
稳 ( 即 时 域 中 的 均值 ,方差 及 频 域 中 的 能 量 谱 在 和 4 间 段 内 不 变 ), 再 加 上 正 态 假设 足 
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以 产生 完全 的 平稳 性 。 
设 (zj 为 一 时 间 序 列 ,把 它 分 成 若干 长 为 的 邻近 的 数据 段 , 记 第 ; 段 为 


Sr (Zuis tt zu) | im 1,2, E 。 通 常 的 方法 是 计算 每 一 数据 段 % 的 统计 量 
7,( 可 以 是 均值 ,方差 ,也 可 以 是 关联 维 数 .Lyapunov 指数 等 ), 如 果 序 列 {7,} 是 近似 
的 常数 序列 ,可 以 认为 这 一 时 间 序 列 是 平稳 的 ,但 这 种 做 法 依赖 于 对 统计 基 7; 的 
性 质 的 了 解 及 它 的 概率 分 布 . 如 果 以 均值 和 方差 作为 统计 量 ,其 优点 是 对 数据 段 长 
HE 4 的 要 求 不 高 ,一 段 1000 点 的 时 间 序 列 足 以 进行 可 靠 的 均值 和 方差 估计 , 且 对 
线性 时 间 序 列 的 分 析 比 较 有 效 5。 但 由 于 没有 考虑 非 线 性 性 ,对 非 线性 时 间 序列 
就 不 太 合适 ,虽然 也 有 文献 这 样 做 了 ,但 对 于 像 心电图 (ECG)、 脑 电 图 (EEG ) 这 样 
具有 复杂 关系 的 非 线 性 时 间 序 列 , 即 使 在 二 阶 矩 不 变 的 一 个 时 间 段 内 也 可 能 是 非 
平稳 的 。 因 此 ,出 现 用 关联 维 数 .Lyapunov 指数 等 代替 均值 .方差 作为 统计 量 的 方 
法 5%] ,虽然 能 反映 非 线 性 性 ,但 出 现 的 问题 是 时 间 段 的 选取 问题 ,因为 太 短 的 时 间 
段 无 法 计算 关联 维 数 .Lyapunov 指数 ,而 太 长 的 时 间 段 ,可 能 就 是 非 平 稳 的 ,因此 
也 无 法 计算 关联 维 数 ,Lyapunov 指数 。 

也 有 不 用 比较 连续 统计 量 的 方法 检验 时 间 序 列 平稳 性 的 方法 ,如 文献 [56] 的 
利用 空间 时 间 分 离 图 的 关联 维 数 估计 法 、 文 献 L57] 的 统计 方法 和 文献 L[58，59] 的 
递归 图 法 。 递 归 图 法 检验 时 间 序列 平稳 性 的 基本 思想 是 画 出 相 空 间 中 每 个 开始 点 
的 最 近邻 点 的 坐标 ,如 果 形 式 对 任 一 初始 点 都 类 似 , 则 系统 是 平稳 的 ,这 种 方法 要 
用 到 多 维 模式 识别 、 聚 类 分 析 等 方法 。 

文献 [60] 提 出 一 种 新 的 方法 是 建立 在 时 间 序 列 不 同 部 分 本 身 间 的 相似 性 而 不 
是 从 时 间 序 列 由 局 部 平均 导出 参数 的 相似 性 的 基础 上 ,这 种 方法 特别 适合 非 平 稳 
性 是 由 吸引 子 形状 变化 造成 的 而 此 时 动力 系统 不 变量 保持 不 变 的 情况 。 在 文献 
[60] 中 定义 了 一 对 时 间 段 st,s; 的 统计 量 7 二 7( st,s)) ,原则 上 ,7( sisi) 可 以 是 任 
何 对 * 和 s; 差异 敏感 的 统计 量 。 对 实际 应 用 而 言 , 7 的 严格 理论 定义 并 不 重要 , 重 
要 的 是 对 相对 较 短 的 sis; 获得 稳定 和 可 靠 的 估计 ,满足 这 一 标准 的 一 个 统计 量 是 
一 个 简单 非 线性 预测 算法 的 误差 ( 正 交 预 测 误差 )。 具 局 部 常数 近似 的 预测 对 几 百 
或 更 少 的 点 产生 稳定 的 结果 ,而 全 局 非 线性 预测 可 对 更 少 的 点 实现 。 从 理论 上 讲 更 
吸引 人 的 是 文献 [61] 定 义 的 正 交 关联 积分 ,但 为 了 获得 稳定 的 结果 , 它 要 求 较 长 的 
时 间 段 和 较 低 的 噪声 。 


BE si = {Luini Zu-iuszs exa) som Urgspia szg-pieestt mad m 为 最 小 
嵌入 维 数 , 记 
Sia = {TDitamtir TaDitamter ToDita} » n = mm le —1 
(2. 60) 
Shan = {ZODitamtio ToDitamtar t s EZg-pea) » n — m,m d 1,4 —1 


(2.61) 
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EE e 及 sin ALA sin fe BRS it FS BD 


s 1 
Töten = Tats], 2 Teon (2. 62) 
Son 


rz 
其 中 
ws) = sio sip — s.l e) (2. 63) 
RP, Juels) | AR AR RA 28 SY Ts! 的 样本 均值 作为 
Zzo-brnti 的 估计 。 
因此 ,给 定 si FR s) AQHA ALAM RAE Gri s) EW 


Y(ssj) = pS Gua — zg-a)? (2. 64) 
34 sis) E RE AEB A AY FEARS PIM SEP RET TB) EH), BUDE Cs} SF ORI 
JÆ LH Xt f EY Cis DRE FAEERE Gus. PEF Y Goes 天 


Yls),s!)。 


2.5 基于 观测 时 间 序 列 的 系统 非 线性 性 检验 


由 于 混沌 现象 必然 发 生 在 非 线 性 系统 内 ,要 用 混沌 理论 和 方法 从 观测 或 实验 
获得 时 间 序 列 中 去 分 析 原 复杂 系统 ,必须 检验 观测 或 实验 获得 的 时 间 序 列 是 否 来 
自 于 非 线性 系统 。 因 此 ,在 对 观测 时 间 序 列 进行 相 空 间 重 构 之 前 ,首先 面临 的 一 个 
问题 是 :获得 的 时 间 序 列 是 源 自 于 线性 系统 还 是 非 线性 系统 ? 

假设 实际 问题 中 的 复杂 系统 由 式 (2. 9) 的 差分 方程 或 式 (2.10) 的 微分 方程 描 
述 ,系统 状态 不 可 直接 观测 ,但 可 通过 式 (2. 11) 或 式 (2. 12) 进 行 观测 。 当 式 (2. 9) 或 
式 (2.10) 中 的 下 是 线性 时 , 称 动力 系统 是 线性 的 ; 当 F 是 非 线 性 时 , 称 动力 系统 是 
非 线性 的 。 当 函数 和 至少 有 一 是 非 线性 时 ,时 间 序 列 {x,} 是 非 线 性 的 ,这 意味 
着 时 间 序 列 的 非 线性 性 不 等 价 于 动力 系统 的 非 线 性 性 ,因为 时 间 序 列 的 非 线性 性 
可 能 是 由 于 观测 函数 h 而 不 是 系统 本 身 的 函数 造成 的 。 

基于 观测 时 间 序 列 的 系统 非 线 性 性 检验 的 目标 是 从 观测 或 实验 获得 的 时 间 序 
列 {z,} 中 , 尽 可 能 多 地 去 获取 函数 F 的 信息 。 需 要 解决 的 问题 是 F 是 线性 的 还 是 
非 线性 的 。 当 且 仅 当 已 是 非 线 性 时 , 才 可 预期 动力 系统 具有 感 兴趣 的 确定 性 成 分 ， 
如 非 线性 极限 环 或 混沌 吸引 子 ( 确 定性 混沌 永远 不 会 出 现在 线性 系统 中 ) 。 

检验 观测 或 实验 获得 的 时 间 序 列 是 否 来 自 于 非 线性 系统 的 一 种 方法 是 
J. Theiler 提出 的 替代 数据 法 *' 中。 这 种 方法 的 基本 思想 是 :对 某 一 观测 时 间 序 
列 ,限定 某 些 线性 过 程 作为 零 假设 , 零 假 设 定 义 了 候选 的 一 种 过 程 , 它 也 许可 能 也 
许 不 可 能 恰当 地 解释 原 时 间 序 列 ,然后 根据 零 假设 生成 相应 的 蔡 代 时 间 序 列 ,分 别 
计算 原 时 间 序 列 和 根据 零 假设 生成 的 多 组 替代 时 间 序 列 的 判别 统计 量 


quenter, 
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(discriminating statistic) S& 19 Bit li (test statistic) 。 如 果 原 时 间 序 列 的 判别 
统计 量 不 在 零 假设 对 应 的 多 组 蔡 代 时 间 序 列 的 判别 统计 量 的 分 布 中 , 则 可 拒绝 零 
假设 ,由 此 可 检验 动力 系统 的 非 线 性 性 。 

替代 数据 法 检验 观测 时 间 序 列 是 否 来 自 于 非 线性 系统 的 过 程 可 以 用 图 2.7 
表示 。 


观测 或 实验 获得 的 时 
WIRE (2), 


符 代 时 间 序 列 


EYL AL 2M 


计算 判别 统计 量 
Qp i12, M 


计算 判别 统计 量 
9, 


判别 统计 量 2 是 否 
在 ,的 分 布 中 


图 2.7 替代 数据 法 检验 时 间 序 列 是 否 来 自 于 非 线性 系统 的 流程 


由 图 2.7 可 以 发 现 ,利用 替代 数据 法 检验 观测 时 间 序 列 是 否 来 自 于 非 线 性 系 
统 需 要 解决 以 下 三 个 问题 : 

D 如 何 根据 零 假设 生成 替代 时 间 序 列 ? 

2) 选取 什么 量 作为 判别 统计 量 ? 

3) 如 何 判断 是 否 拒 绝 零 假设 ? 

下 面具 体 介 绍 这 三 个 问题 是 如 何 解决 的 。 


2.5.1 堆 假 设 及 替代 时 间 序 列 的 约束 生成 算法 


零 假设 是 对 时 间 序 列 特征 的 一 种 假设 性 猜测 , 它 是 产生 替代 时 间 序 列 的 依据 。 
不 同 的 零 假设 对 应 不 同 的 替代 时 间 序列 生成 算法 ,其 基本 思想 就 是 把 原 时 间 序 列 
当成 满足 零 假设 的 某 一 随机 过 程 的 一 个 实现 ,替代 时 间 序 列 生 成 算法 就 是 研究 如 
何 生 成 该 过 程 的 其 他 实现 。 通常 的 有 两 种 实现 方式 , 即 经 典 实现 (typical 
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realization) 和 约束 实现 (constrained realization) 经 典 实现 就 是 利用 传统 的 自助 法 
提取 详细 的 模型 方程 ,然后 运行 产生 Monte Carlo 样本 ,只 要 模型 方程 能 成 功 地 提 
取 , 这 种 方法 可 以 非常 成 功 地 计算 置信 区 间 。 但 约束 实现 方法 更 适合 假设 检验 , 它 
通过 对 原 时 间 序 列 直接 进行 随机 化 ,避免 了 拟 合 模型 方程 ,建立 在 Fourier 变换 基 
础 上 的 替代 时 间 序 列 生成 法 就 是 一 种 约束 实现 方法 。 由 约束 实现 生成 的 替代 时 间 
序列 是 一 种 随机 时 间 序 列 , 但 要 求 它 与 原 时 间 序 列 有 相同 的 样本 自 相关 函数 (因此 
也 有 相同 的 功率 谱 ) 和 相同 的 幅度 分 布 , 即 满足 下 面 两 个 条 件 : 

1) Rs(7) 二 Rxw,T 二 1,2,… ta PR 是 样本 自 相关 函数 ,towx 是 充分 大 的 
延迟 时 间 间 隔 。 

2) AG) = AGO (8K FG) =F GO) ,其 中 A(x) 是 观测 时 间 序列 {zx,) 代 ,的 
先 验 幅度 分 布 ( F(zx) 是 {xz}?! 的 样本 累积 密度 函数 ) 。 

下 面 介绍 不 同 零 假设 下 用 约束 实现 生成 替代 时 间 序 列 的 几 种 不 同方 法 。 


1. Fourier 变换 算法 (FT) 
零 假设 : 原 时 间 序 列 来 自 具有 常 系 数 的 高 斯 线性 随机 过 程 , 即 


2 
s= Dase + Dom- i (2. 65) 


FE 7, SEIS EAE HÉA o 的 高 斯 自 噪声 ， 8. ) - N CO 05) RH (s 8 — i 
高 斯 白 噪 声 激励 的 ARMA (p,q) 模 型 的 输出 序列 。 
gi sb eA PLE FY 做 以 下 离散 Fourier 变换 


.2x(k — DG — 1) 
= z,exp| — i sk =1, 2,0 N (2. 66) 
B » [ N ] 


Wü Be RT Ta RI (Z, t m 


z= b Sven ciqnexo[i 2h —DOG—D].,— 1,2, (2.67) 


其 中 0a 二 2r,k 二 1,2,…,N 是 随机 数 。 
由 于 实测 时 间 序 列 {zo)-: 一 般 为 实数 ,而 由 式 (2. 67) 产 生 的 替代 时 间 序 列 
{ 艺 ) 必 :可 能 是 复数 ,这 样 会 造成 原始 数据 中 某 些 固有 特性 流失 到 虚 部 中 ,为 了 保 
证 替代 时 间 序 列 {z,} 半 ,也 是 实数 ,我 们 要 求 0<a<<2x,k 二 1,2,… ,NN 满足 以 下 关 
系 ( 这 里 假设 N 是 偶数 , 当 N 是 奇数 时 可 类 似 处 理 ): 
a, = ay,, 0 (2. 68) 
x (2. 69) 


a, — — Onsen, k = 2,3, 


上 面 的 关系 可 由 图 2. 8 形象 地 说 明 。 
事实 上 ,在 式 (2. 68)、 式 (2. 69) 的 条 件 下 ,对 nm 一 1,2,…,N 有 
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图 2.8 随机 数 w 满足 的 关系 
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一 实数 (2.70) 
其 中 第 三 个 等 式 中 用 到 了 变换 j—1=N— G— D, BI j=NN 十 2 一 k; 第 五 个 等 式 中 
用 到 了 式 (2. 68) 和 式 (2. 69). 

关于 随机 数 w 的 取 法 ,文献 [64] 中 对 服从 均匀 分 布 的 随机 数 (用 Monte Carlo 
随机 取 余 方法 产生 和 服从 正 态 分 布 的 随机 数 进行 了 数值 模拟 ,表明 服从 不 同 分 布 
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的 随机 数 生成 的 替代 时 间 序 列 对 原 时 间 序 列 的 非 线性 性 判别 几乎 没有 影响 ,只 要 
保证 随机 数 的 生成 是 充分 随机 的 即 可 ,因此 ,为 简单 起 见 , 可 取 满 足 式 (2. 68) 5X 
(2. 69) 的 均匀 分 布 的 随机 数 wm。 

利用 Fourier 变换 的 性 质 可 知 ,由 式 (2. 67) 生 成 的 替代 时 间 序 列 {z,}Y, 与 原 
时 间 序 列 {z,}) 总 ,有 相同 的 自 相关 函数 (等 价 地 ,有 相同 的 Fourier 功率 谱 ), 但 它们 
的 分 布 幅度 不 一 定 相同 。 另 外 ,拒绝 这 样 的 零 假设 ,只 能 说 明 原 时 间 序 列 是 非 高 斯 
线性 随机 过 程 ,即使 具有 非 线 性 性 ,这 种 非 线 性 性 是 由 系统 造成 的 ,还 是 由 观测 造 
成 的 并 不 清楚 ,为 此 文献 [63] 提 出 了 下 面 的 幅度 调节 Fourier 变换 算法 。 


2. 幅度 调节 Fourier 算法 (AAFT) 


零 假设 : 原 时 间 序 列 来 自 具有 常 系数 的 高 斯 线性 随机 过 程 经 过 单调 静态 非 线 
性 变换 , 即 xz, 二 zx(s,), 其 中 {s,) 并 ! 是 具有 常 系数 的 高 斯 线性 随机 过 程 ,x(。) 称 为 
“静态 的 ”static) 或 “即时 的 ”(instantuous) ,因而 z, 只 依赖 于 s, 而 与 s, 的 过 去 值 
无 关 。 另 外 还 要 求 x(。) 是 单调 函数 , 即 r FE. 

这 样 的 零 假 设 显然 包含 了 FT 算法 中 的 零 假设 , 且 可 用 于 检验 系统 的 动态 非 
线性 性 。 

AAFT 算法 的 基本 思想 是 :首先 按 比例 排列 原 时 间 序 列 , 使 它 与 一 个 高 斯 分 
布 一 致 ,然后 对 重 排 的 时 间 序 列 进行 相位 随机 化 ,最 后 对 相位 随机 化 后 的 时 间 序 列 
按 比 例 重 排 ,使 它 有 原 时 间 序 列 的 幅度 分 布 ,具体 步骤 如 下 5 。 

步 又 1: 模拟 xz-'( 即 记录 与 {z,)2, 有 相同 排列 结构 的 白 噪声 , 记 为 {r,}-1)。 
首先 生成 一 个 高 斯 时 间 序 列 {g,)*-,, 其 中 每 一 个 元 独立 地 从 一 个 高 斯 伪 随机 数 生 
成 。 记 rank(z,) 为 x, 的 升序 阶 数 [例如 , 若 z 是 {z,}*-! 中 的 第 3 个 最 小 , 则 rank 
(zw) 一 3], 则 重新 按 比 例 排列 的 序列 为 

Ta = EG) = Baap n = 1,2, N (2.71) 

步 又 2: Kt {rhai Pk Fourier 变换 ,并 加 一 随机 相位 ,然后 做 Fourier 反 变 换 ， 
PEEHI EA (P, imi o 

步骤 3: 模拟 x CBRE TES (Paha AAE HEA HIR E 
EJ (rahim 89 SAB H (Fa a I RUE XE g R, B 

元 = BG) = Xeno: n = 1,2, N (2. 72) 

SSPE AB Bl BS ES [8] FFA ( Z.)i RB DEEP Cc, ) zi RRA BE. EAR ZS 

{en} tn EO WBE 5) AB JE 56S — BAY ALE 1109 BSR RAE zx(。) 单 调 上 且 步 又 
1 和 步 又 3 分 别 成 功 地 模拟 了 z-:(。) 和 z(。) 的 情况 下 才 是 相同 的 。 

若 Fe 表示 高 斯 累积 密度 函数 ({s) 六 :、{r) 六 :和 人 Fo) 六 ,是 相同 的 ), 则 由 步骤 1 
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的 记录 可 得 m=&(zo) 一 Fii(F-(zo)) 。 由 于 zC* 28938 0E — EEL F F CD 
如 果 N 无 限 ,{s,) 信 ,和 {x,} 半 ,在 标准 化 情况 下 是 相等 的 ),g 和 z- 一致 ,这 样 获 得 
BA (ra eR R (=R) =R Ce) 5 Bb Gs) Mao {ra) 代 1: 和 {21 是 同一 高 斯 过 程 
的 实现 ,而 且 通 过 一 个 依赖 于 g 的 函数 ?建立 了 ROAM R:(r) 之 间 的 关系 , 即 
R.G) —4( R,(r)) 。 相 应 地 ,由 步骤 3 的 记录 可 得 元 一 & GO — FL Fo) H 
rg .RiG)—9«G,G)-—gG,G) ,这样 Rz(r) 一 Re(r) 。 

在 实际 应 用 中 ,一 般 nC * OR — RE BÉ VIL BD 8 cC ) 单 调 ,步骤 1 中 的 模拟 也 不 
可 能 完全 精确 , 即 g 一 般 不 是 非 线 性 测量 函数 x(。) 的 真正 逆 , 而 且 式 (2.72) 中 的 
E 5j g^ 一 般 也 不 一 样 ,因此 这 样 生成 的 替代 时 间 序 列 与 原 时 间 序 列 列 自 关联 不 
可 能 完全 一 样 ,这 样 当 判别 统计 量 对 自 关联 敏感 时 , 自 关联 的 偏差 会 导致 错误 地 拒 
绝 零 假设 。 文献 [65] 指 出 ,对 具 长 相干 时 间 (long coherent time) 的 时 间 序 列 ,用 
AAFT 算法 会 错误 地 拒绝 零 假设 。 

为 了 去 掉 对 oC + ) 单 调 这 一 要 求 ,文献 [66] 提 出 了 下 面 的 迭代 算法 。 


3. 和 迭代 的 幅度 调节 Fourier 算法 (IAAFT) 


零 假设 : 原 时 间 序 列 来 自 具 常 系数 的 高 斯 线性 随机 过 程 经 过 静态 非 线性 变 
换 ,这 里 对 非 线性 转换 函数 x(。) 不 要 求 可 逆 。 

由 AAFT 算法 ,生成 的 替代 时 间 序 列 与 原 时 间 序 列 的 自 相关 函 数 有 偏差 ,可 
以 通过 多 次 迭代 的 方法 使 这 种 偏差 限定 在 预期 的 范围 内 。 

BRL TAF A (ary iE 


inte | Xen; 2x(k — D 一 gil 

XL (cn) May 28 DET] SF FA Caos) 22 CL E FT 00) E HE A DRE LB 
生成 算法 过 程 如 下 。 

步骤 1: 由 AAFT 算法 或 对 原 时 间 序列 的 一 个 简单 随机 重 排 产 生 初 始 替代 时 
BIER GE 2. 

步 又 2: 迭代 。 分 为 两 个 连续 的 过 程 : 

D EP? 是 Fourier 域 中 的 粗粮 的 滤波 。 即 对 {Zz”} 江 ,做 离散 Fourier 变换 


w- Lanes: zmG-DG-D)»,oinews 2.70 


»R=1,2,,N (2.73) 


然后 做 反 变 换 ， i » 用 代替 y5, 且 保持 相位 exp GV) — 5f? / 158? | B 


j2:4—De-n] " 


= ae X |ynlexp Gv? dexp| 一 D -L2sN (2.75) 
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2) OES? 由 重新 排列 顺序 产生 , 即 
XQ au co Ps n = ,2,,N (2.76) 
BERIETE, Tex Fo ae H, 5 rO 的 功率 谱 相同 (相应 地 自 关 联 
也 相同 ) ,在 迭代 的 第 二 步 中 ,r9 与 区 + 的 幅度 分 布 一 致 。 但 第 一 步 迭 代 中 保持 
的 功率 谱 在 第 二 步 达 代 中 被 改变 ,因此 需 多 次 近代 ,在 每 次 迭代 后 ,检查 功率 谱 的 
剩余 偏差 ,直至 达到 要 求 的 精度 为 止 .最 后 能 达到 的 精度 依赖 于 原始 数据 的 大 小 和 
结构 ,一 般 多 次 迭代 后 足以 保证 假设 测试 的 可 信 讼 。 f 
Jm ROB 3E i GRADUS DL G1 2L FED (en a K ARETE EAA, OE 
间 序列 与 原 时 间 序列 有 相同 的 幅度 分 布 ,但 自 关 联 可 能 发 生 偏差 ,文献 [67] 记 这 种 
和 迭代 算法 为 IAAFT-1; 如 果 要 求 自 关联 一 致 ,而 允许 幅度 分 布 有 偏差 ,可 以 以 
{r 名 入 作为 fm 六 ,的 替代 时 间 序列 ,文献 [67] 记 这 种 算法 为 IAAFT-2。 文 献 [67] 
证 实 ,无 论 IAAFT-1 算法 还 是 IAAFT-2 算法 获得 的 替代 时 间 序 列 要 比 用 AAFT 
算法 获得 的 替代 时 间 序 列 与 原 时 间 序列 的 自 关联 偏差 小 得 多 。 关 于 IAAFT 算法 
的 更 详细 的 讨论 可 见 文献 [67]。 


4. 改进 的 幅度 调节 Fourier 算法 (CAAFT) 


NT EM AAFT 算法 的 零 假 设 中 对 C ) 单 调 这 一 要 求 ,文献 [68] 从 另外 角 
度 提出 了 下 面 的 改进 的 幅度 调节 Fourier 算法 。 

FR: 原 时 间 序 列 来 自 具 常 系数 的 高 斯 线性 随机 过 程 经 过 静态 非 线 性 变 
换 , 但 这 一 变换 不 一 定 是 单调 的 。 

CAAFT 算法 的 过 程 如 下 Cs9， 

3p 9i 1: 对 观测 时 间 序 列 {z,)j 六 ,由 AAFT 算法 ,生成 {r) (FM A 
Gm. 

步骤 2: 选 择 rwx, 对 r 一 1,2,…，,rmx, 分 别 计算 RICO Reo) AM RICO, 

步骤 3: 在 图 R.(r) 一 Ra(r) 中 ,通过 线性 插值 ,获得 分 段 线性 函数 多, 使 
RG)— Y(RiG))., 

JR 4: HER. CO =É R: GO) 计算 Re(r) 。 

JUR 5: 选 择 AR 模型 的 一 个 合适 的 阶 如 (如 p= 0.0 FEA R CO diit 
AR(z) 的 系数 。 

步 又 6: 利 用 稳定 的 AR 模型 生成 {u,)*-1。 

FEET B us TC ERR (we br BI o, m FII (Fo G4) = situ) © 

JUR SPUR 1 至 步 又 8 重复 天 次 ,产生 天 组 时 间 序 列 {to ea (w Iona tts 


(wt Lau 
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步骤 9: PIT E wP Ya Gi? Hoa ts Gi? LBS SER RO LR 
RE , 找 出 最 接近 R.A RO. 

步骤 10: 对 应 选择 的 第 上 次 试验 ,利用 AR 模型 ,步骤 6 和 步骤 7 重复 M 次 ， 
生成 M 组 替代 时 间 序 列 。 

由 CAAFT 算法 生成 的 替代 时 间 序 列 与 原 时 间 序 列 有 相同 的 幅度 分 布 , 且 有 
近似 相同 的 自 关联 ,因此 克服 了 AAFT 算法 生成 的 替代 时 间 序 列 与 原 时 间 序 列 的 
自 关联 偏差 这 一 缺陷 ,用 CAAFT 算法 生成 的 替代 时 间 序 列 用 于 检验 原 时 间 序 列 
是 否 来 自 于 非 线性 系统 时 ,要 比 用 AAFT 算法 生成 的 替代 时 间 序列 更 精确 。 由 
CAAFT 算法 生成 的 替代 时 间 序列 与 原 时 间 序 列 的 自 关 联 的 近似 是 无 偏 的 ,这 种 
近似 的 方差 与 AAFT 算法 产生 的 方差 一 样 大 ,但 大 于 IAAFT 算法 产生 的 方差 ， 
因此 用 CAAFT 算法 比 IAAFT 算法 更 稳健 ,意味 着 如 果 用 CAAFT 算法 生成 的 
替代 时 间 序 列 通过 了 原 时 间 序 列 的 非 线性 性 检验 , 则 这 样 的 非 线性 性 证 据 比 用 
AAFT 算法 或 IAAFT 算法 获得 的 结果 更 可 靠 。 


5. 一 般 的 约 来 随机 化 方法 (GCR) 


在 前 面 的 各 种 替代 时 间 序列 的 生成 算法 中 , 零 假设 通常 根据 原 时 间 序 列 的 一 
个 完全 可 观测 集 的 性 质 限定 .例如 , 零 假设 为 原 时 间 序 列 来 自 具有 常 系数 的 高 斯 线 
性 随机 过 程 ,包括 一 个 可 能 可 逆 也 可 能 不 可 北 的 静态 非 线性 变换 ,所 以 拒绝 零 假设 
并 不 能 说 明 原 时 间 序列 一 定 来 自 于 非 线性 动力 系统 , 它 可 能 来 自 非 高 斯 非 线性 随 
机 过 程 或 来 自 非 静态 测量 函数 (如 z, 一 is,_,) 或 来 自 线性 随机 非 平稳 过 程 等 ,文献 
C69, 70] 的 研究 表明 ,对 非 最 小 相位 的 线性 非 高 斯 过 程 ,用 IAAFT 算法 生成 的 替 
代 时 间 序 列 会 导致 错误 地 拒绝 零 假设 ,文献 [65] 的 研究 也 表明 ,对 循环 平稳 
《cyclostationary) 的 线性 高 斯 过 程 ,用 FT 算法 或 AAFT 算法 生成 的 替代 时 间 序 
列 也 会 导致 错误 地 拒绝 零 假设 .为 了 解决 这 一 问题 ,文献 [71] 提 出 了 一 般 的 约束 随 
机 化 方法 , 它 可 以 检验 原 时 间 序列 的 任何 完全 可 观测 集 的 性 质 导致 的 零 假设 ,包括 
多 变量 时 间 序 列 、 非 平稳 性 、 非 线性 性 或 其 他 约束 .其 基本 思想 是 :首先 根据 某 个 成 
本 函数 EUT) ,指定 约束 Fi( GS)) 一 0, 当 约束 满足 时 , 树 造 的 成 本 函数 有 一 个 
全 局 最 小 解 ,然后 利用 模拟 退火 (simulated annealing) 法 ,对 时 间 序列 {z,)} 六 的 所 
HHIHH R EUZ, 的 最 小 解 。 
设 { 世 ,} 六 ,表示 {z,) 站 ,的 替代 时 间 序列 ,约束 的 通常 形式 为 

Fi( {2})= 0,i=1,2,°,1 (2. 77) 

这 种 约束 可 转换 成 一 个 成 本 函数 


EL) = ( MM CUM |°)? (2.78) 


+ 38° 非 线性 时 间 序 列 分 析 及 其 应 用 


HARRER, E {Zz,)) 有 全 局 最 小 这 一 事实 不 受权 重 e A0 及 阶 9 的 影响 。 在 
9 一 2 时 ,获得 最 小 二 乘 或 L PE q= 时 ,获得 L' 平均; 在 g 一 co 时 ,获得 最 大 
距离 ;而 当 9 趋向 于 零 时 ,几何 平均 也 是 可 能 的 。 

在 具体 实现 时 ,例如 可 考虑 替代 时 间 序 列 {z.) 各 ,的 自 关联 函数 C(r) = 
《TXn-r) 与 原 时 间 序 列 (zx,) 各 ,的 自 关联 务 数 CCr) 一 (zx,-:) 相 同 这 一 要 求 , 则 可 
限定 约束 为 


F.( {%,}) = (re) — C(t), T = 1,2. 0. (2. 79) 
这 样 成 本 函数 可 以 是 
E( (2.)) = max{ |C(r) 一 C(r)| :r= 1,2, 0) (2. 80) 
或 
EUZ) = ( Seco — cole) t (2.81) 


在 这 一 方法 中 ,替代 时 间 序列 的 选取 是 在 原 时 间 序 列 中 取 相 同 的 值 但 不 同 的 
时 间 阶 ,这 可 保证 替代 时 间 序 列 和 原 时 间 序 列 取 自 同一 (未 知 ? 密 度 分 布 的 随机 过 
程 ,通过 对 原 时 间 序列 重新 排序 可 完成 这 一 步 。 为 了 对 {zo}%-; 的 各 种 不 同 排序 求 
成 本 函数 的 最 小 解 ,可 以 利用 模拟 退火 法 ,通过 交换 {zx,}*-! 中 的 次 序 , 构 形 被 更 
新 ,退火 计划 将 确定 是 接受 还 是 拒绝 ,在 一 个 合适 的 冷却 计划 下 ,退火 过 程 可 以 达 
到 任何 要 求 的 精度 。 当然 除了 模拟 退火 法 外 ,遗传 算法 (genetic algorithms) 也 可 用 
于 解决 这 类 问题 。 

对 中 等 长 度 和 较 长 的 时 间 序 列 , 对 给 定 的 约束 ,GCR 算法 生成 的 蔡 代 时 间 序 
列 可 以 非常 精确 ,但 这 是 以 非常 大 的 计算 时 间 为 代价 的 ,因此 这 种 方法 在 实际 应 用 
时 仍 受 到 限制 。 


2.5.2 判别 统计 量 的 选取 


判别 统计 量 是 定量 表征 时 间 序 列 某 个 特性 的 特征 量 , 它 是 判别 实测 时 间 序 列 
与 零 假设 是 否 符合 的 依据 。 如 果实 测 时 间 序 列 的 判别 统计 量 与 由 零 假设 所 生成 的 
替代 时 间 序 列 的 判别 统计 量 不 相符 , 则 认为 零 假设 不 成 立 , 从 而 说 明 实测 时 间 序 列 
具有 零 假设 以 外 的 特征 。 如 果 蔡 代 时 间 序 列 是 用 前 面 的 约束 方法 生成 的 ,理论 上 判 
别 统计 量 可 以 是 任何 非 线 性 测度 。 

常用 的 判别 统计 量 有 以 下 非 线 性 量 。 

(1) 最 大 Lyapunov 指数 

从 观测 或 实验 获得 的 时 间 序 列 计算 最 大 Lyapunov 指数 的 方法 见 2. 3. 3 节 。 

(2) 关联 维 数 

从 观测 或 实验 获得 的 时 间 序 列 计算 关联 维 数 的 方法 见 2.3. 1 节 。 但 用 于 判别 


FOE RRS UT + 39° 


统计 量 时 更 多 的 是 用 关联 维 数 的 极 大 似 然 估计 ,也 称 Takens fiit E, Bn 
CuGr rm) 


Dukes (M, Tor) = TA LY 
f CLEP, 
° 


(2. 82) 


RP, Cw(r,r,m) 是 2.3.1 节 定 义 的 关联 积分 。 

(3) 非 线性 预测 误差 

设 观 测 或 实验 获得 的 时 间 序 列 为 {z,)*i1, 做 式 (2.14) 的 相 空 间 重 构 , 记 xw， 
k—1,2,7K X x, 的 K 个 最 近邻 点 , 则 z+ 的 一 步 预 测 为 


x 
Eri = Prt (2. 83) 
kal 
其 中 


-2 
lx. — x, Il 


=E 
一 
f 

因此 平方 平均 意义 下 的 一 步 预 测 误差 为 


Yur RK) = |y YN Gea = dal (2.85) 


可 作为 判别 统计 量 , 它 具有 计算 简便 的 优点 。 
2.5.3 统计 检验 方法 


如 果 能 获得 观测 时 间 序 列 的 多 次 实现 , 则 直接 利用 Kolmogorov-Smirnov 或 
Mann-Whitney U 检验 比较 实测 时 间 序 列 和 替代 时 间 序 列 的 两 个 完全 分 布 或 利用 
Student ! 检验 只 比较 实测 时 间 序列 和 替代 时 间 序 列 的 分 布 均值 都 是 可 能 的 。 通 过 
把 实测 时 间 序 列 分 成 几 个 短 的 时 间 序 列 也 可 获得 实测 时 间 序 列 的 多 次 实现 ,但 如 
果实 测 时 间 序 列 本 身 就 不 长 , 像 关联 维 数 .Lyapunov 指数 等 判别 统计 量 的 计算 会 
受到 影响 ,实际 问题 中 的 实测 时 间 序 列 一 般 只 能 实现 一 次 ,因此 用 下 面 的 两 种 统计 
检验 方法 。 


1. Sigma 检验 


wh 


(2. 84) 


计算 实测 时 间 序列 的 某 种 判别 统计 量 Qo 和 多 组 蔡 代 时 间 序 列 相应 的 这 种 判 
别 统计 量 的 均值 Q, 和 标准 差 a., 定 义 显著 性 度量 为 


DIFF(Q) = i8 8a (2.86) 


假定 满足 零 假 设 的 时 间 序列 的 判别 统计 量 服 从 高 斯 ( 正 态 ) 分 布 , 则 可 以 通过 正 态 
分 布 的 参数 检验 拒绝 或 接受 零 假设 ,其 显著 性 水 平 p 值 为 
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p= et Z) = 20 — 6(z)] (2.87) 
其 中 


oa =f Jae (2.88) 
查 表 可 得 ,如 一 0. 05 时 ,z 一 1. 96, 表 明 若 取 显著 性 水 平 5 — 0. 05, 则 当 DIFF(QQO 
1. 96 时 ,观测 时 间 序 列 与 替代 时 间 序 列 有 明显 差别 ,观测 时 间 序 列 以 95% 的 置信 
水 平 拒绝 零 假设 。 当 替代 时 间 序 列 的 组 数 越 多 时 ,获得 的 结论 越 可 信 。 


2. Rank-Order 检验 


由 于 满足 零 假设 的 时 间 序 列 的 判别 统计 量 不 一 定 服从 正 态 分 布 (例如 , 零 假设 
是 某 个 线性 高 斯 过 程 的 单调 静态 非 线 性 变换 时 ) ,因此 用 Sigma 检验 这 种 参数 估 
计 方 法 可 能 会 产生 误 判 ,一 种 更 可 靠 的 方法 是 下 面 的 Rank-Order R, 

假定 零 假设 是 真 的 时 拒绝 零 假设 的 概率 为 a, 即 对 应 的 显著 性 水 平 为 (1 一 a) 


X100%, 则 对 单 边 测试 ,生成 M-R- 组 替代 时 间 序 列 , 其 中 是 正 整 数 ,这 样 ， 
包括 原 时 间 序 列 ,有 和 组 时 间 序列 , 则 每 一 组 的 判别 统计 量 都 等 于 全 部 判别 统计 量 
的 最 小 值 的 概率 为 a, 即 如 果 观 测 时 间 序 列 的 判别 统计 量 为 组 时 间 序 列 中 的 最 


小 , 则 拒绝 零 假设 ,对 双边 测试 ,生成 m=- 组 替代 时 间 序 列 , 则 每 一 组 的 判别 
统计 量 都 等 于 全 部 判别 统计 量 的 最 小 值 或 最 大 值 的 概率 为 a, 即 如 果实 测 时 间 序 


列 的 判别 统计 量 为 关 组 时 间 序列 中 的 最 小 或 最 大 , 则 拒绝 零 假设 。 当 上 的 值 较 大 


时 ,测试 结果 比 k=1 更 好 。 为 了 减少 计算 量 ,一 般 取 k=1, 这 样 为 了 95% 的 显著 性 
水 平 ,分 别 需 要 19 或 39 组 替代 时 间 序 列 用 于 单 边 或 双边 测试 。 


2.6 基于 观测 时 间 序 列 的 系统 确定 性 检验 


如 果 系 统 的 将 来 值 可 由 过 去 值 完全 确定 , 则 称 系统 是 确定 性 的 。 例 如 , 式 
(2. 9) 这样 的 差分 方程 或 式 (2.10) 这 样 的 微分 方程 描述 的 系统 ,只 要 函数 下 是 单 
值 的 , 则 这 样 的 系统 的 将 来 状态 zr 或 z(t 十 At) 由 过 去 状态 z, 或 z(z) 完 全 确定 , 因 
而 是 确定 性 的 。 但 对 只 能 获得 观测 时 间 序 列 的 动力 系统 ,这 样 的 下 是 未 知 的 ,因此 
要 从 时 间 序 列 本 身 来 判断 它 是 由 确定 性 机 制 还 是 随机 性 机 制 所 产生 的 。 不 同 机 制 
产生 的 时 间 序 列 在 建立 模型 时 所 用 的 方法 是 不 同 的 ,如 果 是 由 随机 性 机 制 所 产生 
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的 ,就 应 该 采用 统计 学 的 方法 进行 研究 ,如 果 是 由 确定 性 机 制 产生 的 低 维 混沌 系 
统 ,那么 ,无 论 多 么 高 阶 次 的 线性 模型 都 不 可 能 很 好 地 解释 该 系统 ,相反 一 个 低 阶 
非 线性 模型 或 许 能 很 好 地 刻画 原动力 系统 。 


2.6.1 从 非 线性 预测 判断 系统 的 确定 性 


对 确定 性 系统 ,由 于 将 来 的 状态 可 由 以 前 的 状态 完全 确定 ,因此 理论 上 讲 是 完 
全 可 以 预测 的 ;但 当 确 定性 系统 具有 混沌 特征 时 ,由 于 对 初 值 的 敏感 依赖 性 ,测量 
误差 会 不 断 放大 ,因此 虽然 也 可 预测 ,但 预测 并 不 精确 ;随机 系统 是 完全 无 法 预测 
的 。 因 此 对 观测 时 间 序列 ,可 以 用 下 面 的 思想 来 判断 它 是 否 来 自 于 确定 性 系统 : 利 
用 观测 数据 构造 动力 系统 模型 ,然后 考察 据 此 模型 进行 的 预测 是 否 精确 如果 预测 
是 完美 的 , 则 系统 是 完全 确定 的 ;如 果 预 测 较 好 ,但 并 不 完美 , 则 系统 具有 确定 性 成 
分 ;如 果 预 测 非常 糟糕 , 则 系统 没有 确定 性 。 
从 观测 时 间 序 列 中 构造 动力 系统 模型 的 方法 有 很 多 ,从 预测 的 角度 看 ,一 种 简 
单 的 方法 基于 以 下 思想 :假设 x+ 一 F(z,) 中 的 眉 是 连续 的 , 则 对 现在 状态 zx 寻找 
与 其 最 接近 的 状态 zxw ,由 于 FF 的 连续 性 ,保证 了 zn4 与 zrm+: 也 非常 接近 。 
假设 通过 某 个 未 知 的 观测 函数 h(。) 可 以 观测 到 单 变 量 时 间 序 列 {z,)*-1, 作 
式 (2.14) 的 相 空间 重 构 。 为 了 预测 时 间 序列 {z,) 江 ,的 下 一 个 值 ns CN. 时 刻 的 
嵌入 向 量 xm Ca woes EN) ;在 XrxNot1,"…sxN-1 中 寻找 最 靠近 xx 的 
向 量 (为 了 计算 简便 ,可 取 最 大 范 数 作为 距离 定义 ) ,不 妨 记 为 xxw, 即 
| x, — xx ll = ming || x. — ay |] :j= NoNoc 1,N—1) (2.89) 
如 果 xy 与 zwm 充 分 靠近 , 则 zw 与 zxw+1 也 会 非常 接近 ,因此 zw+ 的 预测 值 zw， 
可 取 为 ums BA 
Enyi = Tesi (2. 90) 
这 一 简单 预测 模型 有 许多 改进 ,例如 取 定 xw 后 ,不 是 找 一 个 最 靠近 它 的 向 量 
xv TERS xy 最 接近 的 K 个 向 量 zw ,一 1,2,…, 天 , 取 zw+i 的 预测 值 zw+; 为 
y suya ttt ez e PUES (C LET 


x 
agita (2.9) 
e 


或 者 在 取 定 xw 后 ,对 某 个 s, 记 N Ceux UA x HPD e 为 半径 的 邻 域 , 即 若 zwE 
N Geox W [Ics xe || <e, 取 zw+i 的 预测 值 zw+, 为 
Inu = Wiest 35 xa (2.92) 


PESCE) 
其 中 |N(e,x,) | 表示 邻 域 N(e,x,) 中 向 量 x, 的 个 数 。 当 邻 域内 没有 向 量 与 x 的 距 
离 小 于 e 时 , 则 增加 se, 直到 找到 某 些 向 量 为 止 。 
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为 了 检查 预测 值 zw+i 的 正确 性 ,可 以 通过 与 观测 值 rzw+: 进 行 比较 ,定义 预测 
误差 为 zw+: 与 ry fF. 一 次 预测 可 能 较 好 或 较 差 ,偶然 性 较 大 ,为 了 克服 这 种 偶 
然 性 ,可 以 取 多 次 预测 误差 的 平均 。 假设 有 长 为 N 十 工 的 观测 时 间 序 列 {zvjs, 取 
前 N 个 数据 为 构造 模型 所 需 ,利用 此 模型 来 预测 后 工 个 数据 。 记 zx+, 为 zw 的 预 
测 值 , 则 可 得 平均 预测 误差 

© =P (ays — inn)? (2.93) 


mi 


如 果 e 非 常 大 ,意味 着 预测 不 好 ,因此 时 间 序 列 不 是 来 自 于 确定 性 系统 ;反之 ,如 果 
e 较 小 ,说 明 时 间 序 列 可 能 来 自 于 确定 性 系统 。 
在 利用 前 N 个 数据 预测 zw+ 必 一 1,2,…, 世 时 ,可 以 有 以 下 两 种 不 同 的 方法 ， 
D 利用 前 面 的 方法 预测 N 十 1 时 刻 的 值 zw+1, 然 后 利用 预测 值 zw+ 构 造 一 个 
新 的 嵌入 向 量 
Eyer = È Enpi ENI ENH- on) (2.94) 
找 与 xw+! 最 近 的 向 量 , 预 测 N 十 2 时 刻 的 值 zw+z, 然 后 再 利用 预测 值 zxv+: 构 造 一 
个 新 的 嵌入 向 量 
Ente 一 (ZN+ayTN+2-o ne TN+2 (mLDr) (2.95) 
找 与 xw+: 最 近 的 向 量 ,预测 N 十 3 时 刻 的 值 zw+s, 这 样 一 直下 去 。 这 种 方法 事实 上 
可 用 于 外 推 到 对 超过 观测 时 间 序 列 长 度 的 时 刻 进行 预测 ,虽然 这 种 方法 在 用 于 预 
测 不 远 的 将 来 时 刻 的 值 时 是 有 用 的 ,但 在 判别 时 间 序 列 是 否 来 自 于 确定 性 系统 时 
最 好 还 是 直接 用 已 知 的 观测 数据 , 即 下 面 的 方法 。 
2) 为 了 预测 N 十 2 时 刻 的 值 Ena POE HR A é iE 
Xa = (aware twsines XN ox) (2. 96) 
这 时 虽然 N 十 1 时 刻 的 预测 值 zw+ 已 经 得 到 ,但 还 是 用 on HERE FER 
观测 , 同 理 以 zw+: 而 不 是 zw+z 构 造 嵌 入 向 量 , 依 此 下 去 。 
最 后 要 说 明 的 是 以 什么 标准 衡量 平均 预测 误差 是 大 还 是 小 ,仅仅 从 s 的 数 
值 本 身 无 法 确定 ,因为 6 与 时 间 序 列 {z,)?2Y 的 数值 大 小 有 关 , 而 不 同 问题 中 
{zv)ite 的 数量 级 是 不 一 样 的 .为 了 解决 这 一 问题 ,考虑 如 果 对 每 一 时 刻 N 十 ! 都 取 
相同 的 预测 值 zwne ,使 平均 预测 误差 


Eume = LS (awa — Baume)? (2. 97) 


Same la (2. 98) 


即 这 样 的 预测 值 是 后 工 个 数据 的 均值 ,因此 此 时 的 平均 预测 误差 se 就 是 后 二 个 
数据 的 方差 ,由 于 这 种 预测 是 比较 差 的 ,因此 要 判断 式 (2. 93) 的 平均 预测 误差 的 
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大 小 ,可 让 它 与 后 工 个 数据 的 方差 o* 进行 比较 , 即 若 e/o! 接近 于 1, 则 表明 平均 预 
测 误差 较 大 , 若 c/o? 接近 于 0, 则 表明 平均 预测 误差 6 较 小 。 
这 种 方法 的 相关 内 容 及 应 用 例子 可 见 文献 [74]。 


2.6.2 利用 递归 图 判断 系统 的 确定 性 


理论 上 讲 , 任 何 时 间 序 列 不 是 周期 的 ,就 是 非 周期 的 ,然而 当 出 现 观测 噪声 时 ， 
从 周期 系统 中 观测 的 时 间 序列 可 能 出 现 非 周期 性 。 非 周期 性 意味 着 状态 变量 永远 
不 会 严格 地 回 到 它们 以 前 的 值 ,但 在 一 个 非 周 期 系统 中 ,状态 变量 可 能 回 到 非常 靠 
近 以 前 某 时 刻 的 状态 ,因此 可 通过 刻画 这 种 靠近 程度 和 刻画 经 过 多 久 才 会 出 现 这 
种 靠近 等 来 描述 非 周期 程度 。 

由 于 不 能 直接 测量 系统 的 所 有 状态 变量 ,需要 利用 嵌入 技术 把 获得 的 测量 数 
据 表 示 为 状态 变量 。 设 {zx,) 并 为 观测 获得 的 时 间 序 列 , 做 式 (2. 14) 的 相 空 间 重 构 ， 
得 向 量 x, 每 一 个 x, 是 m 维 贬 入 空间 中 的 一 个 点 ,代表 了 系统 在 时 刻 m 的 状态 。 

计算 i 和 jj 两 个 时 刻 x, 入) 的 距离 0,= || x 一 x 上 ,如 果 时 间 序 列 以 了 为 周 
期 , 则 当 |i 一 让 =nT(n==0,1,…) 时 ,6 二 0; 相 反 , 对 非 周 期 时 间 序 列 ,6;, 就 没有 这 
样 的 性 质 。 为 此 考虑 以 下 问题 :假设 取 定 某 个 距离 ,什么 时 候 会 出 现 | xx, || < 
r。 解 决 这 一 问题 的 一 种 方法 是 以 i 作为 模 坐 标 ,以 j 作为 纵 坐标 作 图 , 当 
lxx ll < 时 ,在 (i, 力 处 作 一 个 点 ,这 样 的 图 叫做 递归 图 (recurrence plots), È 
描述 了 重 构 的 轨 线 是 如 何 递归 或 重复 其 自身 的 ,揭示 了 系统 的 时 间 关 联 信息 。 当 > 
固定 时 ,递归 图 关于 对 角 线 对 称 , 如 果 在 不 同 的 点 处 ~ 取得 不 一 样 ,递归 图 也 可 以 
不 对 称 。 

例 2.3 二 次 映射 


za = 3.52. — Ta) (2.99) 
它 的 轨 线 是 以 4 为 周期 的 , 当 m=2,r=1,r=0. 001 时 ,其 递归 图 见 图 2.98 —2, 
r—]1,r—0.01 时 ,其 递归 图 见 图 2. 10。 


100 g 100. 
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Æ 2.9 (2.99) r—0. 001 时 的 递归 图 
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图 2.10 式 (2.99) 在 r=0.01 时 的 递归 图 
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例 2.4 混沌 系统 
Tar = Az — x,) (2. 100) 
4 m—2,7—1,7—0.001 时 的 递归 图 见 图 2. 11, 而 当 m=2,r=1,r=0. 01 时 的 递 
归 图 见 图 2. 12。 


100 


图 2.11 5&2. 1004€ r=0. 001 时 的 递归 图 图 2.12 式 (2.100) 在 r=0.01 时 的 递归 图 


例 2.5 HMiULETMR m=2,r=1,r=0. 1 时 的 递归 图 见 图 2. 13,74 m=2, 
r=1,r=1 时 的 递归 图 见 图 2. 14。 


0 20 - 40 60 j 80 100 
图 2.13 随机 白 噪声 在 r=0. 1 时 的 递归 图 图 2.14 随机 白 噪 声 在 r=1 时 的 递归 图 


由 上 述 例子 可 知 , 对 来 自 于 周期 系统 的 时 间 序 列 ,递归 图 为 与 对 角 线 平行 的 一 
些 带 构成 ,这 些 带 之 间 的 间距 为 周期 也。 对 来 自 于 混沌 系统 的 时 间 序列 ,递归 图 有 
更 复杂 的 结构 ,有 一 些 几乎 周期 的 轨 线 的 迹象 ,这 可 以 从 一 些 与 对 角 线 平行 的 ,小 
的 带 中 发 现 ; 来 自 于 随机 系统 的 时 间 序 列 就 没有 这 种 结构 ,其 递归 图 几乎 是 上 尝 无 规 
律 的 。 因 此 递归 图 也 可 以 从 某 种 程度 上 刻画 系统 的 确定 性 特征 。 

递归 图 的 思想 最 早 是 由 J.P. Eckmann 等 在 文献 [75] 中 提出 的 ,关于 递归 图 的 
更 多 内 容 可 见 文献 [76 一 82]。 
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2.7. 观测 时 间 序 列 噪声 处 理 技术 


观测 和 实验 获得 的 时 间 序 列 通常 包含 噪声 ,噪声 的 存在 一 方面 会 淡化 系统 的 
确定 性 , 即 降低 确定 规律 的 显著 性 ; 另 一 方面 又 可 能 提供 一 些 “ 虚 假 的 规律 或 者 确 
定性 ”, 从 而 严重 影响 时 间 序列 的 预测 效果 。 通 过 观测 或 实验 获得 的 时 间 序 列 中 主 
要 含有 测量 噪声 和 系统 噪声 两 种 类 型 的 噪声 。 

测量 噪声 (measurement noise) : 指 观测 量 被 误差 污染 , 它 可 能 由 测量 仪器 引 
起 ,与 动力 系统 本 身 无 关 。 设 动力 系统 满足 za — FGO ,测量 的 量 为 r, 一 A(z,) 十 
ww 其 中 心 。) 是 把 吸引 子 中 的 点 映 为 实数 的 光滑 函数 ,w, 是 随机 数 ,序列 {w} 称 
为 测量 噪声 .这 类 噪声 是 伴随 着 时 间 序列 在 观测 的 时 候 被 释 加 进来 的 ,也 称 为 外 部 
噪声 ,一 般 是 可 以 去 掉 的 。 

系统 噪声 (dynamical noise) : 指 系统 内 小 的 随机 数 在 每 一 步 的 干扰 所 产生 的 
反馈 , 它 由 主要 系统 参数 小 的 随机 波动 的 传播 导致 随机 状 的 波动 引起 ,也 可 能 由 系 
统 内 在 事件 随机 发 生 引 起 , 它 直 接 影 响 系 统 的 实时 演化 。 动 力 系统 满足 
zt1 二 F(z 十 m,)。 这 类 噪声 是 与 外 部 环境 完全 无 关 的 , 即 在 动力 系统 演化 的 过 程 中 
噪声 作为 一 种 输入 进入 系统 ,参与 并 影响 系统 的 演化 ,这 种 噪声 也 称 为 内 部 噪声 。 
内 部 噪声 无 法 通过 简单 的 滤波 技术 处 理 , 需 要 借助 系统 的 演化 特征 进行 处 理 。 

噪声 对 数据 分 析 技 术 的 影响 的 严重 程度 很 大 地 依赖 于 噪声 的 级 别 和 属性 。 例 
如 ,在 数据 处 理 过 程 中 ,系统 噪声 比 测量 噪声 引起 的 问题 更 严重 ,这 是 由 于 有 测量 
噪声 的 情况 下 ,确定 性 系统 中 相 邻 的 干净 的 轨 线 总 存在 。 更 进一步 ,系统 噪声 有 时 
被 解释 为 动力 系统 的 具 小 幅度 的 高 维 确定 性 部 分 。 即 使 不 是 这 样 , 由 于 系统 噪声 会 
诱导 或 延迟 动力 系统 通 向 不 同 的 行为 (例如 分 又 ), 因 此 系统 噪声 对 观测 的 动力 系 
统 可 能 是 本 质 性 的 。 

在 对 观测 时 间 序 列 进行 分 析 时 ,噪声 的 存在 会 产生 很 多 不 利 的 影响 ,这 些 影响 
包括 : 

1) 吸引 子 的 自 相似 性 被 破坏 。 

2) 相 空 间 重 构 后 在 小 标 度 区 间 上 出 现 高 维 。 

3) 相 邻 轨 线 的 发 散 不 是 指数 的 。 

4) 不 管 使 用 哪 种 预测 方法 和 记录 多 少 位 的 数据 ,预测 误差 总 有 下 界 。 

噪声 对 关联 维 数 的 影响 要 小 于 对 Lyapunov JE Xt 48/5803 R/08 ,尤其 小 于 对 预 
测 的 影响 .噪声 对 关联 维 数 .Lyapunov 指数 、 炉 和 预测 的 影响 程度 很 大 地 依赖 于 噪 
声 的 级 别 和 噪声 的 性 质 。 一 般 地 , 当 噪 声 级 接近 于 几 个 百分点 时 ,估计 可 能 变 得 十 
分 不 可 人 和信。 为 此 在 对 观测 时 间 序 列 进行 分 析 前 ,需要 进行 降 噪 处理 ,目前 的 降 品 方 
法 主要 适用 于 测量 噪声 ,还 没有 技术 可 除去 系统 噪声 ,实际 上 ,系统 噪声 是 否 应 该 
除去 也 是 值得 讨论 的 问题 。 
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2.7.1 噪声 级 别 的 估计 


通常 ,可 以 使 用 信 噪 比 来 描述 信号 和 噪声 的 关系 ,信号 强度 和 噪声 强度 的 对 比 
就 叫 “ 信 号 噪声 比 ”(signal to noise ratio) 或 者 简称 S/N. S/N 在 习惯 上 也 经 常 以 
dB 为 单位 来 表示 .这 里 将 使 用 噪声 强度 来 对 信号 和 噪声 之 间 的 强度 对 比 关系 进行 
描述 。 定 义 噪声 级 别 为 =, 假 设 含有 测量 噪声 (假设 为 高 斯 噪声 ) 的 信号 为 y,?y 一 
z 十 6,z 是 原 数据 , 代表 噪声 , 则 = 一 ci/o,o: 是 相应 数据 的 方差 。 

估计 噪声 级 别 的 一 种 常用 方法 是 有 T. Schreiber 提出 的 基于 错误 函数 的 估计 
方法 外。 该 方法 是 基于 非 线性 动力 学 技术 的 一 种 噪声 级 别 估计 算法 ,算法 利用 非 
线性 动力 系统 在 相 空间 中 的 轨迹 演化 特征 受到 噪声 干扰 后 产生 的 变化 量 (与 预期 
轨道 的 偏差 ) 来 判别 噪声 的 级 别 。 该 算法 假设 噪声 为 : 

1) 随机 且 不 相关 的 波动 。 

2) 均值 为 零 且 方 差 固定 。 

3) 噪声 呈 高 斯 分 布 。 

FURR FO ca. 

i⁊ WOR Hd SE EAA Cn) 22i ERO 14) 的 相 空间 重 构 , 按 2. 3. 1 节 的 方法 计 
算 关 联 维 数 4, 对 于 计算 关联 维 数 4 的 曲线 中 存在 的 一 些 波动 ,T. Schreiber 等 认 
为 是 由 于 噪声 引起 的 ,因此 可 以 认为 关联 维 数 和 搜索 半径 参数 r 之 间 存 在 函数 关 
系 , 即 d=d(r), 

ABR k FESR HRA BER, H sro v Lada ua 

dir) — dar) _ FE | ge ze" 
k—m 2e — erf(z) 
AH, erf(。) 为 错误 函数 ;c 为 噪声 级 ;ds(r) 和 d GO) SIDA EA LER k A m 时 
计算 的 关联 维 数 。 通 过 4 取 不 同 值 对 式 (2. 101) 进 行 拟 合 ,可 估计 噪声 级 o。 


该 方法 通过 全 中 二 各 (中 揭示 了 噪声 的 分 布 ,尽管 这 个 方法 不 十 分 严格 ,但 还 


是 在 实际 应 用 中 展示 了 它 的 有 效 性 。 由 于 该 算法 不 能 提供 只 人 二 sc 和 错误 函 


数 的 精确 拟 合 ,大 多 数 情 况 下 通过 下 面 的 办 法 来 计算 噪声 级 o。 
Rt BA rn Gm1,2, 7 DF Rm GH 1,2.) RAR o 可 以 取 使 函数 


(2.101) 


ri 
1 a fasta) —detry rl- 25) 
DY aca BEEN 
达到 最 小 时 的 “ 值 。 
随 着 非 线性 科学 技术 的 发 展 ,特别 是 基于 递归 图 的 定量 分 析 方法 逐步 成 熟 ， 
K. Urbanowicz 和 J. A. Holyst 等 在 2003 4E 38 Hi T — PREF AHO WAGE f E A. 


(2. 102) 


FE PRATER ETI E "47。 


将 T. Schreiber 等 的 基于 错误 函数 的 噪声 估计 方法 和 递归 图 的 定量 分 析 技术 利用 
炳 作为 桥梁 关联 在 一 起 , 称 为 粗糙 纹理 型 炳 估计 方 法 ,这 种 方法 特别 针对 高 噪声 级 
别 的 估计 而 设计 ,具体 算法 可 见 文献 [85]。 另 外 ,文献 [86] 还 给 出 了 一 种 基于 高 斯 
核 权 函 数 的 噪声 级 别 估计 方法 ,该 方法 在 估计 噪声 级 别 准确 度 上 有 一 定 程 度 的 改进 。 


2.7.2 噪声 的 降低 


降低 噪声 一 直 是 信息 处 理 领 域 的 一 个 非常 重要 的 课题 , 它 本 质 上 是 通过 滤波 
来 实现 的 。 经 过 多 年 的 研究 和 应 用 实践 ,人 们 已 经 获得 许多 成 果 ,文献 [87 一 91] 对 
非 线 性 时 间 序列 中 的 噪声 处 理 方法 进行 了 详细 的 说 明 .在 金融 领域 ,常常 采用 移动 
平均 法 来 对 时 间 序 列 进 行 平 滑 处 理 , 它 忽略 了 一 些小 的 波动 而 反映 序列 的 主要 趋 
势 ,因而 本 质 上 也 是 一 种 滤波 技术 。 但 是 ,这 种 方法 非常 粗略 ,在 降 噪声 的 同时 ,把 
许多 有 用 信息 也 一 并 去 掉 了 。 下 面 将 简单 说 明 传统 滤波 方法 及 其 缺陷 并 介绍 基于 
非 线 性 动力 学 的 非 线 性 时 间 序 列 噪声 降低 的 常用 方法 。 


l. 传统 滤波 方法 及 其 缺陷 


传统 的 滤波 理论 是 假定 观测 时 间 序 列 中 的 有 用 数据 和 噪声 数据 具有 不 同 的 频 
谱 , 即 有 用 数据 和 噪声 数据 是 频谱 分 离 的 ,从 而 可 以 设计 一 种 理想 的 滤波 器 H Co) 
进行 噪声 滤波 。 显 然 这 种 滤波 器 没有 考虑 系统 的 其 他 特性 ,例如 系统 的 运行 ( 演 
化 规律、 信号 与 噪声 的 统计 特征 ,因而 这 种 方法 存在 较 多 的 缺陷 .现代 滤波 理论 中 
的 一 个 典型 代表 一 一 维 纳 滤波 理论 提出 :寻找 线性 滤波 器 的 最 佳 冲击 响应 或 传递 
函数 ,使 得 滤波 器 的 输出 波形 为 输入 波形 的 最 佳 估计 。 虽 然 维 纳 滤波 思想 比 标准 滤 
波 器 有 了 明显 的 改进 ,但 这 种 方法 对 时 间 序 列 的 平稳 性 要 求 使 得 它 不 适用 于 许多 
时 间 序 列 的 分 析 和 处 理 。 卡 尔 曼 滤波 器 改 以 最 小 方差 为 估计 标准 来 寻找 一 套 递 推 
估计 ,这 种 方法 适用 于 线性 时 变动 力 系统 产生 的 非 平稳 时 间 序 列 ,但 这 种 方法 要 求 
知道 动力 系统 的 运动 规律 以 建立 准确 的 状态 方程 ,同时 要 求 噪声 的 统计 特性 作为 
一 个 关键 输入 参数 。 对 于 实际 问题 中 复杂 系统 的 观测 时 间 序 列 而 言 这 两 个 要 求 都 
是 无 法 满足 的 。 

另外 一 类 常用 的 噪声 处 理 技术 就 是 小 波 方法 ,其 中 主要 有 两 种 方法 : 模 极 大 值 
法 和 非 线 性 闭 值 法 .小 波 降 品 是 通过 对 信号 进行 多 分 辨 率 分 解 ,可 从 多 个 层次 上 分 
析 和 考察 信号 的 特征 。 由 于 非 平 稳 信号 有 许多 尖峰 和 突变 ,这 些 尖 峰 和 突变 往往 具 - 
有 较 高 的 频率 ,采用 传统 的 滤波 方法 不 能 将 真实 信号 (有 用 信号 ) 的 高 频 干扰 和 品 
声 引起 的 高 频 干 扰 加 以 区 分 。 若 低 通 滤波 带宽 太 罕 , 则 将 一 部 分 有 用 信号 去 掉 了 ， 
引起 信号 失真 ,不 利于 进一步 的 数据 分 析 和 预测 ,而 带宽 太 大 ,又 达 不 到 降 品 的 目 
的 。 利 用 小 波 对 信号 进行 多 分 辨 率 处 理 时 ,实际 上 相当 于 对 信号 同时 进行 低 通 和 高 
通 滤波 ,其 低频 系数 主要 反映 真实 信号 ,而 高 频 系 数 主要 反映 噪声 和 真实 信号 的 细 
节 信息 ,但 信号 的 细节 信息 与 噪声 在 高 频 分 解 系数 中 会 表现 出 一 些 不 同 的 特性 ,这 
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正 是 利用 小 波 进行 降 噪 的 切入 点 。 事 实 上 ,对 复杂 系统 的 观测 时 间 序 列 来 说 ,很 难 
给 噪声 一 个 准确 的 定义 。 通 常 那些 随机 性 强 、 无 法 从 中 找 出 有 价值 的 规律 的 信号 都 
可 视 为 噪声 信号 。 按 这 样 的 观点 ,任意 形式 分 布 的 信号 都 可 能 归 为 噪声 。 但 问题 是 
在 对 时 间 序 列 进行 处 理 之 前 ,我 们 难以 辨别 哪些 信号 会 对 系统 的 确定 性 表现 有 贡 
献 , 而 哪些 会 起 干扰 。 因此 , 按 保 守 的 观点 ,一 般 将 噪声 定义 为 高 斯 白 噪声 形式 。 这 
样 一 个 假设 对 实际 复杂 系统 的 观测 时 间 序 列 的 分 析 和 预测 而 言 是 有 诸多 问题 的 ， 
其 中 不 仅仅 包含 外 部 测量 噪声 ,而 且 有 很 多 噪声 又 作为 输入 反馈 进入 动力 系统 成 
为 内 在 噪声 。 

通过 以 上 对 传统 的 滤波 技术 分 析 , 可 以 明确 这 类 方法 对 实际 复杂 系统 的 观测 
时 间 序 列 的 降 噪 是 不 合适 的 ,从 而 需要 采用 基于 非 线性 动力 学 技术 的 噪声 降低 技 
术 来 处 理 实际 复杂 系统 的 观测 时 间 序 列 中 的 噪声 。 这 类 方法 主要 是 通过 重 构 非 线 
性 动力 系统 的 相 空 间 , 研 究 吸引 子 的 演化 轨迹 特征 ,从 而 进行 噪声 降低 。 


2. 简单 非 线 性 降 嗓 法 


简单 非 线性 降 品 法 是 一 种 非常 简单 的 非 线 性 时 间 序列 降 噪 方法 ,具有 计算 复 
杂 程 度 低 .计算 速度 快 的 优点 69。 其 核心 思想 是 :使 用 观测 时 间 序 列 的 局 部 平均 值 
代替 时 间 序 列 的 中 间 值 ,这 是 基于 该 时 间 序 列 由 一 个 连续 动力 系统 产生 的 这 一 
假设 。 

噪声 降低 的 过 程 非常 简单 ,首先 将 观测 时 间 序 列 嵌 入 到 合适 的 空间 ,嵌入 空间 
的 维 数 必须 高 于 其 理论 上 需求 的 圣 入 维 数 。 对 于 每 个 嵌入 向 量 x,, 在 相 空 间 中 找 
Hh xn HY e BIR u(x) = {xj : |] x;—x, || 天 e}, 邻 域 的 搜索 半径 应 大 于 噪声 的 级 
别 但 应 小 于 吸引 子 的 典型 曲率 半径 。 由 于 这 两 个 条 件 很 难 同 时 满足 ,因此 必须 根据 
处 理 结果 进行 反复 调整 .如 果 噪 声 级 别 小 于 吸引 子 典型 曲率 半径 , 则 可 以 使 搜索 半 
径 为 噪声 级 别 的 2 到 3 倍 。 

对 于 人 嵌入 向 量 xn = Greene GX BE r*=1), 修 正 过 的 中 间 值 
Zn-mz 可 以 通过 计算 zxe(x,) 的 平均 值得 到 , 即 

-ja = — M rime (2.103) 


"T 
在 计算 完成 后 ,所 有 参与 过 计算 的 z, 都 被 替代 为 zx. 重新 调整 搜索 半径 ,再 进行 下 
次 达 代 ,这 样 就 可 得 到 降 噪 后 的 时 间 序 列 {z,}21。 

为 了 检验 算法 的 有 效 性 ,对 例 2. 1 的 Henon 映射 进行 仿真 计算 。 图 2. 15 是 干 
净 的 Henon 映射 吸引 子 ,图 2. 16 是 施加 40% 的 Gauss 白 噪声 的 Henon 映射 吸引 
子 ,图 2. 17 是 通过 上 述 方 法 降 噪 后 的 Henon 映射 吸引 子 。 

可 见 ,图 2. 17 的 吸引 子 与 原动力 系统 产生 的 干净 时 间 序 列 经 重 构 所 得 的 吸引 
子 整体 形状 基本 相同 ,部 分 细节 特征 仍 可 保留 。 很 明显 ,对 于 受到 高 级 别 噪声 污染 
的 非 线 性 时 间 序 列 ,该 算法 可 以 有 效 恢 复 并 保持 原 有 动力 系统 的 特性 。 
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图 2.15 干净 的 Henon 的 吸引 子 


2.16 受到 噪声 干扰 的 Henon 吸引 子 
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图 2.17 降 噪 后 的 Henon 吸引 子 
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实际 问题 中 的 复杂 系统 往往 是 由 多 个 变量 描述 的 ,通过 观测 或 实验 可 获取 多 
变量 时 间 序列 ,例如 从 一 个 研究 的 系统 中 同时 记录 几 个 不 同 的 变量 , 像 气象 学 中 的 
大 气压 ,温度 和 湿度 ,生理 学 中 的 心率 ,血压 .呼吸 和 血 氧 饱和 度 ,经 济 学 中 一 些 货 
币 相互 之 间 的 汇率 .证 券 市 场 的 分 类 指数 时 间 序 列 等 ;或 者 在 空间 扩展 系统 中 ,从 
不 同 空间 位 置 获得 多 道 记录 , 像 庙 流 、 卫 星 数据 、 心 电 图 和 脑 电 图 等 ,对 这 些 多 变量 
时 间 序 列 , 同 样 需要 研究 以 下 问题 :通过 观测 或 实验 获得 的 时 间 序列 是 来 自 于 线性 
系统 还 是 非 线 性 系统 ? 

对 单 变量 时 间 序 列 , 这 一 问题 已 在 2. 5 节 中 进行 过 较 详细 的 讨论 。 对 多 变量 时 
间 序 列 ,文献 [93~95] 利 用 信息 论 中 的 炳 定义 线性 元 余 和 克 余 ,线性 元 余 与 元 余 之 
间 的 差异 可 用 于 定性 地 检验 实测 时 间 序 列 是 否 来 自 于 非 线 性 系统 ;也 可 把 元 余 作 
为 判别 统计 量 , 利 用 2. 5 节 中 的 替代 数据 法 来 定量 地 检验 实测 时 间 序列 是 否 来 自 
于 非 线 性 系统 ,与 2. 5 节 中 的 相关 方法 相 比 ,这 种 方法 至 少 有 三 大 优点 :第 一 ,为 了 
检验 变量 之 间 各 种 特殊 的 依赖 性 ,包括 条 件 依赖 性 ,可 定义 各 种 不 同类 型 的 元 余 ， 
第 二 ,元 余 可 作为 时 间 延 迟 间 隔 的 函数 ,因此 研究 的 依赖 性 不 是 基于 统计 的 思想 而 
是 基于 动力 系统 的 思想 ;第 三 ,对 应 于 各 种 元 余 , 它 们 的 线性 元 余 也 存在 ,这 些 线性 
元 余 可 以 用 于 检验 生成 的 替代 数据 的 质量 ,这 样 可 避免 由 于 生成 的 将 代数 据 的 不 
完美 造成 的 非 线 性 特性 的 虚假 检验 。 

文献 [93 一 95] 中 提出 的 方法 在 实际 应 用 中 的 困难 在 于 对 实测 的 多 变量 时 间 序 
列 , 利 用 概率 计算 其 元 余 非 常 麻烦 ,我 们 把 这 一 方法 推广 到 广义 元 余 ,建立 了 广义 
元 余 与 广义 关联 积分 之 间 的 关系 ,从 而 可 用 广义 关联 积分 来 计算 广义 元 余 , 计 算 比 
较 简 便 , 可 操作 性 较 强 .在 此 基础 上 建立 了 定性 和 定量 检验 多 变量 时 间 序 列 是 否 来 
自 于 非 线性 系统 的 方法 号。 


3.1 随机 变量 的 线性 元 余 和 广义 元 余 


设 随机 变量 X Xon ,Xi 的 概率 密度 分 别 为 po Gr ,pa(z2),… pi Gn BB 
机 向 量 (X,,Xs:,…,Xz) 的 概率 密度 为 prs n2 ,zxL)。 定 义 离散 随机 变量 X, 的 gq 
BY Renyi #429" 


HX) = 一 


1— 


glow: D Loin Y. b= auae Ls 9 天 1 (3.1) 
- 
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H (Xd = 一 Y) piGologiL pio]. L= 1,2:.L (3.2) 
定义 随机 变量 X,,X:，…,Xz 的 联合 9 Br Renyi HHO” 


HX Xi XD = 1 ion. D [prozra mvzD]，9 关 1 G3» 


nnm 


H(X Xo X0 一 一 DS) PCziyra anlogipGn ezss trn) (3.4) 


显然 , 式 (3.2) 和 式 (3. 4) 分 别 是 式 (3. 1) 和 式 (3. 3)) 当 9771 时 的 极限 , 即 g 
1 时 ,Renyi flf Shannon Ji, 
无 论 g 取 什 么 值 ,可 定义 定量 刻画 了 包含 在 XXn XL 中 公共 信息 的 平均 
数 的 了 个 变量 X Xeon XL 的 广义 元 余 
ROG Xi X1) = HX) 十 … BORD — HX Xe KL) (3.5) 
q=1 时 , 即 为 文献 [93 一 95] 中 的 宛 余 。 
定义 定量 刻画 了 变量 Xi 包含 在 变量 Xi,X:,…,Xz-: 中 信息 的 平均 数 的 广义 
WATER A 
BLOG ms Xia X) S HOO mS Ki) HOG) — HX) Xa Xp) 
—RE mS XX — ROG XL) (3.6) 
还 可 定义 定量 刻画 变量 间或 变量 群 之 间 信息 平均 数 的 各 种 类 型 的 广义 宛 余 。 
例如 ,考虑 变量 Xi，… Xn Yoto Yg Zo Zy WENER SALT 
RA 
ROG n Xn Yoe YZZ) 
= HXi Xa) HOS SYL) HS Zu) 
一 HXi Xn Yio Y ZiZa) (3.7) 
或 者 定义 变量 群 X AY 一 起 与 Z 之 间 的 广义 元 余 ( 可 看 作 是 广义 边缘 元 余 在 群 变 
其 之 间 的 推广 ) 为 
ROC n Xn Yie 
= HQOG 50 Xn YY) + HGonsZu) 
一 HG Xg Yit YZ Z1) (3.8) 
HEX Xo Xi H LEMNE, RO IE S 41d EE. thy ERE MEOS. 
C= (Gi), d € H C BOE REPE, GE E MTR, | 6 BEATA E B T UK, WEE 
Tit Gaussian 分 布 的 密度 分 布 函 数 为 " 


Hi 1/2 L 
PCT Tzs) = ew — a Dexa} 


[zr 


按 前 面 的 定义 计算 其 联合 qg 阶 Renyi «i£ E & Shannon 4i. 8 
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HG, X, X= TI pale [debe fel 一 4 Dtme] drda] 


HLED 
- Low [deseos] 


zur 1 Lega 
= og Log; C) + 5 log.lC| + 2 0-D'4*! (3.9) 


A(X X25 X= limH, OG, Xi, X1) 
* 


一 二 Clogs(2xe) + Zog: |C| (3.10) 
因此 无 论 9 取 什 么 值 ,其 广义 元 余 都 为 
ROG XX) 一 logsce, )— Llog; |C] (3.11) 


其 中 |C1= [[A4.4 J& C 的 特征 值 。 可 以 发 现 ,多 变量 Gauss 分 布 的 广义 宛 余 与 9 
jai 
无 关 , 为 此 ,我 们 定义 任意 随机 变量 X,,X:,…,Xz 的 线性 元 余 为 


LOG, Xass X1) = lys) 一 FlogeiC| (3.12) 


其 中 |C|= Ip sà; dé C 的 特征 值 ,C 为 协 方差 矩阵 。 

当 随机 变量 Xi, Xo Xo N L E Gauss 分 布 时 ,广义 元 余 与 线性 元 余 是 一 
致 的 。 特 别 当 Xi Xor Xe 具有 均值 零 ,方差 1,C HRA EE Aj 15,2, L 
为 C 的 特征 值 时 ， 

LOG, X, X1) 一 T Sloga (3.13) 
类 似 地 ,定义 定量 刻画 Xi 在 Xi X2 ,XL_! 中 的 线性 依赖 性 的 线性 边缘 元 余 为 
ACK n Riis Ke) = LOGS Ko XD — LOG Xi (1 
广义 宛 余 检验 了 研究 数据 的 所 有 依赖 性 ,而 线性 宛 余 只 考虑 线性 依赖 性 。 


3.2 时 间 序 列 广义 宛 余 的 计算 


实测 多 变量 时 间 序 列 {zr}) 六 ,G 一 1,2,…,) 可 以 认为 是 多 变量 平稳 遍历 随机 
TLE XX XL 的 实现 , 则 p; Cx) — prob (X19 (x11 zio x0) 0152,77, 
L) plaisas x1) =prob{ X; = (T11 aiat TLN) X2= Groaszza ttt xoa tts 
XL 二 (zLisTL2，… ,TL.N)}。 由 于 遍历 性 ,所 有 的 信息 论 函 数 可 以 由 时 间 平 均 代替 
总 体 平均 进行 估计 。 为 了 便于 计算 ,把 多 变量 时 间 序 列 {zrojocli( 一 1,2,…, 了 ) 每 
一 变量 分 别 标准 化 , 即 令 
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le l« z 
TENE 
Mirihi (0 1,2, LORS (COSE EW 1, 这样 线性 元 余 可 由 式 (3. 13) 直 接 
计算 ,其 中 关联 矩阵 的 特征 值 可 由 文献 [101] 中 的 SVDCMP 程序 计算 。 

实测 多 变量 时 间 序列 的 广义 宛 余 可 由 以 下 两 种 方法 计算 。 
3.2.1 直方 图 及 合计 数 法 

为 了 计算 H(X) EISE ELE TA Cni 102i U= 1,2, LK min{zi t n=l, 
2, N)f| max {zin : n—71,2,*, NME K 等 分 ,此 时 计算 精度 为 

max {zn : n = 1,2,1, min : n = 1,2, N} 
à = K t (3.16) 

利用 直方 图 可 得 每 个 小 区 间 内 的 概率 p(k)(% 二 1,2,… KO DUI 


HD =] l glee: D Loo 1 
^4 


zl 


)0D—dp2,U.L;n—d.2,.NO— (3.15) 


x 
=p glee le), 1-piheL (3.17) 


im 


为 了 计算 HQOG Xa X) ,最 直接 的 方法 是 利用 盒 计数 法 , 即 L 维 空间 被 
分 成 一 系列 大 小 为 6 的 超 立 方 体 (6 为 直径 ), 设 为 天 个 ,计算 第 k 个 小 立方 体内 的 


点 数 n MER pr 一 沈 (4 二 2,…,K), 因 此 


HG, Xi 5 XL) = 


I 1l "s D DG) 


nmm, 
1 K 
— Joe 2. Cp) 
1 STEAK 
-rhed |$) (3.18) 


文献 [95] 在 q— 1 的 情况 下 提出 了 依赖 于 局 部 密度 的 改进 算法 ,但 这 些 方法 在 
实现 时 都 比较 复杂 , 且 费 时 。 


3.2.2 关联 积分 计算 法 


jg L HEISE xi— Gross tt za 5j xj Gragszsgsttt zj) 之 间 的 距离 为 
flax, |] = max {zuz : 1L) (也 可 以 取 欧 氏 范 数 )， 则 


D Hí(r — lxi — xj ll) RRR x 本 身 外 到 x 的 距离 小 于 7 的 x; 的 点 数 ,其 中 


jm 
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+ ) 是 Heavside 函数 ,定义 工 BERET [8] FE P (x, BY q 阶 广义 关联 积分 为 


x mS 
Cio = (Les 3 ne - lx; — x; |l 1] jJ !o (319 


34 9—2 时 就 是 通常 的 关联 积分 ,g 一 1 时 , 即 为 一 阶 广义 关联 积分 , 即 
logsC{(r) —log; limC; (r) 


-1 


N |o 
IÈ Hr- dx-zxp] 


1 jn 


=} doe M =a 5 Hí(r— lx; — xl) (3. 20) 
ur 


jd Piltar roast rtr) Go 1,2, NAPE Goa ei yzLi) 点 处 ,半径 为 
-agnam annn 


D paar ERES. 3 PACTE TEO Jn! 


2i os [aT 
N g [%] 
y AG" la- Y^ 
act r= |[xi— A 
"x à s OTT ca 
因此 , 当 9 天 1 时 
HO, XH XL)= jog: = Cpl zi zn)? 
— 
dx qp DA z 
bui iR lz 一 ai] |} 
— log.Ch(r) (3. 22) 
4 g=1 时 ,在 式 (3. 21) 两 边 取 对 数 , 然 后 同 除 9 一 1, 令 o> 1 08 
H(X Xi. XD = DS) plates Ti)logap (Ti «ane xn) 
mug, 
x x 
cd 1 
ms Wye why 2; 8 lx — x1] 
— log:C{(r) (3. 23) 
同 理 , 无 论 q 取 什 么 值 ,都 有 
H(X) — — log; Cii G) (3.24) 


其 中 Ch Cr) & ORE BET I] FE (ns) ea q 阶 广义 积分 ,2 一 1,2，… 工 。 
要 注意 的 是 ,这 里 单 变量 时 间 序 列 没 有 作 延 迟 重 构 , 即 当 /=1,2,…, 工 时 
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N — 
1 1 ee 
Chir) = bz 12;B0 = |z,— ail) | } > 4*1 
(3. 25) 
1« 1 < 
logsCl(r) = Dlos y — 1 DD H(r ~ lz — 2151) (3. 26) 
e sins 


这 样 ,可 得 用 广义 关联 积分 表示 的 广义 元 余 和 广义 边缘 元 余 , 即 
RXis Kays X1) =HXD) + HG) — BOG Xs XL) 


Cio) 
log: RAD) LL. 
=log, TCh) (3.27) 


PX m XUL Kr) S ROS yee XL XL) 一 RGG XL 


Cie) 
log; O A 
一 log: EOC (3.28) 


3.8 系统 非 线 性 性 的 定性 和 定量 检验 


对 实测 多 变量 时 间 序 列 {zio)-,z 一 1,2,…, 工 ,研究 延迟 时 间 序 列 之 间 的 依 
赖 性 是 可 能 的 和 有 用 的 。 假 设 时 间 序 列 是 平稳 的 , 则 广义 元 余 Ry Gne amne tti 
Einte A ROT n, PE REIS BY TE) niin ,ri-! 的 函数 ,因此 可 得 广义 元 余 和 广 
义 边缘 元 余 
Ry Cty stay te te) = Re (Lins Lente EU FEL (3. 29) 
By stet mua) = Rey rem yt) 一 RalTi T29 TL2) — (3.30) 
T8] , tto a 18 c AS BE SE ſa PE] (ns 22i 411,2, 7L 的 线性 元 余 和 线性 边缘 元 余 
Lysate Te) = LC tins Lente, itt VEL 1) (3.31) 
ACT Tey tet TL1) = LG termo) — LG tase Tez) (3. 32) 
这 一 方法 同样 可 用 于 单 变量 时 间 序 列 , 对 实测 单 变量 时 间 序 列 {z,)*-,, 通 过 
相 空 间 重 构 为 m 维 向 量 x. (Ers Ears s Ennor) € R'ii- No Nel, N), 
其 中 mvr 为 正 整 数 , 若 把 {z,)}, tuned ms {Zs-m-we) 分 别 看 作 是 随机 变量 X,,X;， 
sy Xm 的 实现 , 则 在 假设 时 间 序列 是 平稳 的 条 件 下 ,Ru (zu Dames tttm = 
R(X Xi X 5j n BK, AR m A r 有关, 因此 可 得 单 变量 时 间 序 列 {z,)o=: 
的 广义 元 余 和 广义 边缘 元 余 
REO) = Ra lEn mre ttt Thm Dr) (3.33) 
Aj) = Re(r) 一 RI (Cr) (3.34) 
同 理 , 可 得 单 变量 时 间 序列 {z.}*-: 的 线性 元 余 和 线性 边缘 元 余 
L(t) = LG, zt Xs) (3. 35) 
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X") = L(t) — L" e) (3. 36) 
3.3.1 系统 非 线性 性 的 定性 检验 


根据 定义 ,线性 宛 余 只 刻画 了 研究 的 时 间 序 列 的 线性 结构 ,而 广义 元 余 刻画 了 
研究 的 时 间 序 列 的 非 线 性 结构 ,因此 可 比较 广义 宛 余 RO nemi ODERT CO] 
和 线性 元 余 LG totns D L"CO T tte ,ri-1( 或 r) 的 图 形 。 如 果 它 
们 的 形状 相同 或 非常 类 似 , 则 足以 认为 研究 的 时 间 序列 可 用 线性 过 程 描述 ,而 较 大 
的 差异 表明 不 同 变量 的 时 间 序列 之 间 (或 时 间 序列 与 它 的 延迟 时 间 序 列 之 间 ) 具 有 
非 线性 关系 。 这 一 过 程 可 以 用 图 3. 1 表示 。 


观测 或 实验 获得 的 多 变量 时 间 序 列 


图 3.1 利用 元 余 定性 检验 系统 非 线 性 性 的 流程 图 


值得 注意 的 是 ,要 比较 的 是 Ry OS onn RT CO 15 Littra) 
[或 L^ GO JF. myrz,…yrz-i( 或 z) 的 函数 的 形状 ,而 不 是 它们 特殊 的 数值 ,这 是 
由 于 它们 的 不 同 数值 性 质 所 致 。 对 固定 的 m FI ty ote yee te Rr) LCi teres 
re [R L^ 0) ] RS iB E PUES & HERE 3E R. CS ote eee nu D RT CO KR 
FERRARE ORAS E [e] ed I BUR ARE ,估计 的 Ru OS ote yt D RT CO JE 
越 大 ), 因 此 不 能 用 任何 正式 的 统计 程序 定量 地 确定 广义 元 余 之 间 是 否 有 显著 差 
异 , 但 Ry Cer ote ye ,tL-)[ 或 RY(7)] 的 形状 对 不 同 的 剖 分 是 一 样 的 ,因此 定性 的 比 
较 是 可 能 的 ,由 此 可 检验 观测 或 实验 获得 的 时 间 序 列 是 来 自 于 线性 系统 还 是 非 线 
性 系统 。 实 际 应 用 中 ,对 多 变量 实测 时 间 序 列 , 可 计算 R On neni LG 
mrr-i) 的 一 些 一 维 截面 , 即 取 其 中 一 个 为 r, 其 余 为 零 。 
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3.3.2 系统 非 线 性 性 的 定量 检验 


为 了 定量 地 研究 观测 时 间 序 列 是 否 来 自 非 线性 系统 ,可 以 把 线性 元 余 和 广义 
元 余 作为 检验 统计 量 , 利 用 2. 5 节 的 替代 数据 法 进行 检验 。 

由 于 在 实际 应 用 中 利用 Fourier 变换 生成 的 替代 时 间 序 列 不 总 是 保持 观测 时 
间 序 列 的 线性 性 质 ,因此 ,只 有 观测 时 间 序 列 和 替代 时 间 序 列 的 广义 宛 余 有 明显 差 
异 , 而 它们 的 线性 元 余 没 有 明显 差异 时 ,认为 观测 时 间 序 列 来 自 于 非 线 性 系统 才 比 
较 合理 ,因此 ,同时 用 线性 元 余 和 广义 元 余 作 为 检验 统计 量 比 其 他 检验 统计 量具 有 
更 好 的 效果 。 

利用 线性 元 余 和 广义 元 余 检 验 系 统 非 线 性 性 的 过 程 如 图 3. 2 所 示 。 


观测 或 实验 获 得 的 多 szar 根据 学 做 没 生成 的 
变量 时 间 序列 多 组 替代 时 间 序 列 


检验 替代 时 间 序 


列 的 有 效 性 


图 3.2 利 思 元 余 定量 检验 系统 非 线 性 性 的 流程 图 


设 {zojo=:0 一 1,2,…,) 为 标准 化 后 的 观测 时 间 序列 ,对 每 个 变量 分 别 做 以 
下 离散 Fourier 变换 


x Zx(À— = 
y= $) anexp| ~i £—DG-D), aiio s Ni I=L (3.37) 


其 中 i=~vV 一 1。 在 区 间 [ 一 x,*j 内 取 N 个 随机 数 w(k 一 1,2,…,N) SRE 
a = ay, =0 (3. 38) 
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4, — — Ont2-tr k = 2,340, 


然后 做 以 下 离散 Fourier HEHE 


v 
zb Dy yexp diodexp jZ-Do-D 


N 
2 (3. 39) 


s n=1,2, N; 一 1 2 


(3. 40) 
FU AB Cri. 3 n-10.— 1,27 LORS ERB TAD FE I (Fie Mes = 1,2, 2. 

由 文献 [102] 可 知 ,这 样 生成 的 蔡 代 时 间 序 列 是 线性 Gaussian 多 维 随机 时 间 
序列 ,但 对 每 个 1==1,2,…, 工 , {zn) 江 1 与 {Zn) 和 ,有 相同 的 幅度 分 布 ,从 而 有 相同 
的 自 相关 函数 ,因此 替代 时 间 序列 保持 了 原 时 间 序 列 的 所 有 线性 性 质 ,但 改变 了 原 
时 间 序 列 的 非 线 性 性 。 

根据 需要 ,多 变量 时 间 序 列 的 替代 时 间 序 列 也 可 由 2. 5. 1 节 中 的 其 他 方法 (如 
AAFT IAAFT 等 ) 生 成 。 

记 Ry Cty ote gees ote AM LCT strt ,rt1-1) 分 别 为 观测 多 变量 时 间 序列 (zw) 入 ， 
CL= 1525006 DHT MICRA RE TUR RCT toy et te AML (ry tay te) 
KEE RAL TE EFA) Tinh C= 1,2, LR I7 SCTCAR PU ACTETU ARS s ECRIRE IT 
序列 的 生成 原理 知 它们 是 线性 的 ,因此 


Res(riyrzyyrL-1) = L? CTi Te 9288 Tr) (3. 41) 
由 于 替代 时 间 序 列 和 原 时 间 序 列 有 相同 的 自 关联 函数 , 则 

L(t, stort tr) = LOG step Te) (3. 42) 
这 样 

R. Cty otsto tua) 一 了 (rr Te) (3. 43) 
等 价 于 

R,G temm) = RY nem) (3. 44) 


由 于 比较 的 量具 有 相同 的 数值 性 质 , 只 要 在 估计 Ry GG emos rna HEROS 
rz,…rz-i) 时 用 相同 的 数值 参数 ,它们 的 值 就 可 以 定量 地 比较 .具体 应 用 中 可 定义 
如 下 广义 元 余 和 线性 元 余 的 显著 性 检验 统计 量 : 
| Ry Gi t2 tmu) — R Cst) | 

Og, Ttt TLG) 


DIFFR, — (3.45) 


|LG testi — Ey tee sty) | 
DICERE 
RP, ORG nem D Gunn PH ES AS RS IRL JE PLI TR 
和 线性 宛 余 的 均值 ;aa(riyrz,…rz-) 和 oz(ryr…rz-0) 分 别 是 它们 的 标准 差 。 
如 果 广 义 元 余 和 线性 元 余 服 从 正 态 分 布 ( 数 值 实验 表明 这 样 的 假设 是 合理 
的 ), 则 对 观测 时 间 序 列 所 作 的 零 假设 当 显著 性 检验 统计 量 的 值 大 于 1. 96 时 可 以 
以 小 于 5% 的 显著 水 平 被 拒绝 。 


DIFFL = 


(3. 46) 
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同 理 可 定义 线性 边缘 元 余 和 广义 边缘 宛 余 的 显著 性 检验 统计 量 。 实 际 应 用 中 ， 
同 定性 检验 类 似 , 对 多 变量 实测 时 间 序列 ,可 计算 R, On no n LCt t 
… ,TL-1) 的 一 些 一 维 截 面 , 即 取 其 中 一 个 为 ,其余 为 零 。 

对 单 变量 观测 时 间 序 列 ,根据 零 假设 生成 替代 时 间 序 列 后 ,同样 可 以 由 广义 元 
余 和 线性 元 余 的 显著 性 检验 统计 量 : 
DIFFR? (t) = ROE (o 
rozo (3.48) 
RP, RE (tr) 和 L”(r) 分 别 是 观测 时 间 序 列 的 广义 元 余 和 线性 元 余 , 分 别 由 式 
(3.33) 和 式 (3. 35) 计 算 ;R?(r) 和 L"(r) 分 别 是 根据 零 假设 生成 的 多 组 蔡 代 时 间 序 
列 的 广义 元 余 和 线性 元 余 的 均值 ;or(r) 和 oz(r) 分 别 是 它们 的 标准 差 。 

由 于 在 实际 应 用 中 利用 Fourier 变换 生成 的 替代 时 间 序 列 不 总 是 保持 原始 数 
据 的 线性 性 质 ,因此 ,只 有 原 时 间 序 列 和 替代 时 间 序 列 的 线性 元 余 没 有 明显 差异 
时 ,而 它们 的 广义 元 余 产 生 明 显 的 差异 时 拒绝 零 假设 才 不 会 产生 由 于 替代 时 间 序 
列 的 线性 性 质变 化 而 引起 的 错误 结果 ,但 当 观 测 时 间 序列 和 替代 时 间 序 列 的 线性 
宛 余 也 产生 显著 差异 时 ,不 能 理所当然 地 认为 研究 的 系统 具有 非 线性 特征 ,因为 这 
样 的 替代 时 间 序 列 未 能 保持 原 时 间 序列 的 自 关 联 函 数 。 


3.4 仿真 模拟 
例 3.1 两 变量 线性 自 回归 模型 


Din = 0. 9zlo-l 十 Orn 


(3.47) 


DIFFL"(r) = 


(3. 49) 
Lan = 0. 9in1 十 Toni F Ozn 


其 中 onor EERE ,方差 为 1 的 随机 时 间 序列 。 

取 初 始点 ze 一 0,zz.o 一 0, 和 迭代 生成 长 度 20 000 的 时 间 序 列 。 去 掉 前 3000 个 
点 ,从 第 3001 PAR REBAR BEN = 102484 R BERE T8] FEF (1221071, 2 作为 研 
SEXES ,其 时 间 历程 图 如 图 3. 3 所 示 。 

为 了 方便 计算 , 先 将 两 变量 时 间 序 列 中 每 个 变量 时 间 序列 分 别 标准 化 , 即 得 到 
各 变量 均值 为 零 ,方差 为 1 的 两 变量 时 间 序列 {zij%ivt 一 1,2。 

零 假 设 1: 时 间 序 列 来 自 具 常 系数 的 高 斯 线性 随机 过 程 。 

利用 2.5.1 节 中 随机 相位 化 Fourier 变换 (FT) 方 法 生产 19 组 替代 两 变量 时 
间 序 列 , 经 计算 ,线性 宛 余 的 显著 性 检验 统计 量 DIFFL Gris Tente) EF BY MA] EIB 
间隔 c 的 函数 如 图 3.4(a) 所 示 , 广义 元 余 的 显著 性 检验 统计 量 DIFFR, Gross 
Zz.n+r) 关 于 时 间 延 迟 间 隔 c 的 函数 如 图 3. 4 (b) Ca — 1), E 3.4 (0 (9 — 2) fff 
图 3.4(d)(g==3) 所 示 . 可 见 , 线 性 元 余 的 显著 性 检验 统计 量 的 值 小 于 1. 96, 这 表明 
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0 100 200 — 300 400 500 * 600 700 800 — 900 1000 


图 3.3 两 变量 线性 自 回归 模型 的 时 间 历 程 图 


原 时 间 序 列 与 替代 时 间 序 列 的 线性 依赖 结构 没 明显 差异 , 即 生成 的 替代 时 间 序 列 
是 好 的 。 同 时 广义 元 余 的 显著 性 检验 统计 量 的 值 几乎 都 小 于 1. 96, 即 不 能 有 效 地 
拒绝 时 间 序 列 来 自 具 常 系数 的 高 斯 线性 随机 过 程 这 一 零 假 设 ,因此 可 以 认为 时 间 
序列 来 自 的 系统 不 具有 非 线 性 特征 ,与 实际 情况 一 致 


DIFFL 


DIFFR; 


08 Hs 


02 y = 
0 10 20 30 o 10 20 30 


E r 
(a) RETRL (b) 广义 完 余 R 


0 10 20 30 
r 


(©) T TER Ry (3) 广义 元 余 局 
图 3.4 零 假设 1 下 线性 元 余 和 广义 元 余 的 显著 性 检验 统计 量 
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零 假设 2: 时 间 序 列 来 自 具 常 系数 的 高 斯 线性 随机 过 程 经 过 单调 静态 非 线性 变换 。 

利用 2. 5. 1 节 中 迭代 的 幅度 调节 Fourier 变换 (IAAFT) 方 法 生产 19 组 替代 
两 变量 时 间 序 列 , 经 计算 ,线性 元 余 的 显著 性 检验 统计 量 DIFFL Go sine. 
时 间 延 迟 间隔 + 的 函数 如 图 3. 5Ca) 所 示 , 广 义 元 余 的 显著 性 检验 统计 量 DIFFR。 
(zlunizam+r) 关 于 时 间 延 迟 间隔 r 的 函数 如 图 3. 5Cb) (gq 二 1)、 图 3. 5 (0 q=2 AA 
3.5(d) (gq 二 3) 所 示 。 可 见 线性 元 余 的 显著 性 检验 统计 量 的 值 小 于 1. 96, 这 表明 原 
时 间 序 列 与 替代 时 间 序 列 的 线性 依赖 结构 没 明显 差异 , 即 生成 的 替代 时 间 序 列 是 
好 的 。 同 时 广义 元 余 的 显著 性 检验 统计 量 的 值 几乎 都 小 于 1. 96, 即 不 能 有 效 地 拒 
绝 时 间 序 列 来 自 具 常 系数 的 高 斯 线性 随机 过 程 经 过 静态 非 线 性 变换 这 一 零 假设 ， 


因此 可 以 认为 时 间 序 列 来 自 的 系统 不 具有 非 线性 特征 ,与 实际 情况 一 致 。 


DIFFR, 


0 10 20 30 
r 


r 
(a) REIR L (b) XIR R, 


DIFFR; 
DIFFRy 


1 20 30 0 10 20 
(©) OUR R (d) 广义 元 余 
图 3.5 零 假设 2 下 线性 宛 余 和 广义 宛 余 的 显著 性 检验 统计 量 


例 3.2 Lorenz 系统 
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h=0. 04 ,精度 为 0. 0001 ,利用 四 阶 Runge-Kute 法 积分 ,迭代 生成 长 度 20 000 的 
时 间 序 列 。 去 掉 前 3000 个 点 ,从 第 3001 个 点 开始 取 长 度 N=1024 的 三 变量 时 间 
序列 {zzwjxi(L 一 1,2,3) 作 为 研究 对 象 , 其 时 间 历 程 图 如 图 3. 6 所 示 。 
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图 3.6 Lorenz 系统 的 时 间 历 程 图 

为 了 方便 计算 , 先 将 三 变量 原 时 间 序列 的 每 变量 时 间 序列 标准 化 , 即 得 到 各 变 
量 均 值 为 零 ,方差 为 1 B] S AE BERE TRU (rh 0152,32. 

零 假设 1: 时 间 序 列 来 自 具 常 系数 的 高 斯 线性 随机 过 程 。 

利用 2.5.1 节 中 随机 相位 化 Fourier 变换 (FT) 方 法 生产 19 组 替代 三 变量 时 
闻 序 列 经 计算 , 线 星 纪 余 的 显著 性 检验 统计 量 DIFF 工 (zio;zzw+rizsm) 关 于 时 间 
延迟 间隔 的 函数 如 图 13:7(a) 所 示 , 广义 元 余 显 著 性 检验 统计 量 DIFFR Gris s 
iae ria) ACT SE [8] SES [8] RS = 的 函数 如 图 3. 7 (b) (o — DD E 3.7(c)(9 一 2) 和 图 
3. 7(d) (q 2 D BER. 

线性 边缘 元 余 Mains Lenses Dan) SS MRI p. Gn Lenses Tsn) BO BE 
性 检验 统计 量 DIFFA Caini Eontr Lsn) MI DIFF Oy Gris Tentei zs) Wit A BRM 
图 3. 8 所 示 。 
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图 3.7 零 假 设 1 下 线性 宛 余 和 广义 宛 余 的 显著 性 检验 统计 量 
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图 3.8 零 假设 1 下 线性 边缘 元 余 和 广义 边缘 元 余 的 显著 性 检验 统计 量 
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z| 


[ 见 ,线性 宛 余 的 显著 性 检验 统计 量 的 数值 都 小 于 1. 96, 这 样 原 时 间 序 列 与 
替代 数据 的 线性 依赖 结构 没有 明显 差异 , 即 蔡 代 时 间 序 列 在 技术 上 是 好 的 ,不 应 该 
产生 虚假 的 检验 结果 。 但 广义 宛 余 的 显著 性 检验 统计 量 的 数值 较 大 ,可 以 以 95% 
的 概率 拒绝 时 间 序 列 来 自 具 常 系数 的 高 斯 线性 随机 过 程 这 一 零 假设 , 即 可 认为 时 
间 序 列 来 自 的 系统 具有 非 线性 性 ,与 实际 的 情况 相 吻合 。 

零 假 设 2: 时 间 序列 来 自 具 常 系数 的 高 斯 线性 随机 过 程 经 过 单调 静态 非 线性 
变换 。 
利用 2. 5. 1 节 中 迭代 的 幅度 调节 Fourier 变换 (IAAFT) 方 法 生产 19 组 替代 
三 变量 时 间 序 列 , 经 计算 ,线性 元 余 的 显著 性 检验 统计 量 DIFFL Gris sirena 
关于 时 间 延 迟 间 隔 e 的 函数 如 图 3.9(a) 所 示 , 广 义 元 余 显著 性 检验 统计 量 
DIFF R, Gri s i2, eins 42 HF BF [8] HEI [8] f. + 的 函数 如 图 3. 9 (b) (= DD TH 3.9 
(c)(q=2) AIM 3. 9 (4) (q— 32 BER. 
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图 3.9 零 假 设 2 下 线性 元 余 和 广义 元 余 的 显著 性 检验 统计 其 
线性 边缘 元 余 Ari ns Lente Lsn) FT” CHR ICR 0, Gnaeus su BO 
性 检验 统计 景 DIFFAGG au 5 Tentei Lae) E DIFF 2, (21.03 Tonts Tsa) ME 3.10 所 示 。 
可 见 线性 元 余 的 显著 性 检验 统计 量 的 数值 很 小 ,而 在 24030 线性 元 余 的 
显著 性 检验 统计 量 出 现 大 于 2 的 现象 ,这 可 能 与 数据 较 少 有 关系 。 但 广义 元 余 的 显 
著 性 检验 统计 量 的 数值 较 大 ,可 以 以 95% 的 概率 拒绝 时 间 序 列 来 自 具 常 系数 的 高 
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图 3.10 零 假设 2 FRE TEP AI LATRA PEE eit iit 
斯 线性 随机 过 程 经 过 静态 非 线性 变换 这 一 零 假设 , 即 可 认为 时 间 序 列 来 自 的 系统 
具有 非 线性 性 ,与 实际 的 情况 相 吻 合 。 

例 3.3 白 噪声 时 间 序列 。 

人 工 生成 长 度 为 20 000 的 三 个 变量 的 白 噪声 时 间 序 列 ,去 掉 每 一 变量 的 前 面 
3000 个 点 ,从 第 3001 个 点 选取 长 度 NN 二 1024 BY EBERT IBI RETI (ns) 20.1.2, 
3) 作 为 研究 对 象 ,其 时 间 历 程 图 如 图 3. 11 所 示 。 

为 了 方便 计算 , 先 将 三 变量 原 时间 序 列 的 每 变量 时 间 序列 标准 化 , 即 得 到 各 变 
量 均值 为 零 ,方差 为 1 的 多 变量 时 间 序 列 {zrj-1(L 一 1,2,3)。 

零 假 设 1: 时 间 序列 来 自 具 常 系数 的 高 斯 线性 随机 过 程 。 

利用 2. 5. 1 节 中 随机 相位 化 Fourier 变换 (FT) 方 法 生产 19 组 替代 三 变量 时 
间 序 列 , 经 计算 ,线性 元 余 的 显著 性 检验 统计 量 DIFF 忆 (zivyzzs+rizso) 关 于 时 间 
延迟 间隔 c 的 函数 如 图 3.12(a) 所 示 , 广 义 元 余 显著 性 检验 统计 量 DIFFR (zi 
Graec ZX3,n) 关 于 时 间 延 迟 间 隔 + 的 函数 见 图 3. 125) (9 — D FH 3. 12 (0) (9 — 2) 
图 3.12(d)(q=3) tm. 
线性 边缘 元 余 ACs Leeteh Can) ST OH RTL Oy (Tit Tentei Lan) OY BH 
性 检验 统计 量 DIFFA Coins 2entes Lsn) E DIFF, (rin Lente s Lan) B] TT AAR UH 
图 3. 1380 。 
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图 3.12 SB 1 下 线性 元 余 和 广义 元 余 的 显著 性 检验 统计 量 
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图 3.13 零 假设 1 下 线性 边缘 元 余 和 广义 边缘 元 余 的 显著 性 检验 统计 量 


可 见 线性 元 余 的 显著 性 检验 统计 量 都 很 小 ,这 表明 原 时 间 序 列 与 苦 代 时 间 序 
列 的 线性 依赖 结构 没 明显 差异 , 即 生成 的 替代 时 间 序列 是 好 的 。 同 时 广义 宛 余 的 显 
著 性 检验 统计 量 的 值 几乎 都 小 于 1. 96, 即 不 能 有 效 地 拒绝 时 间 序 列 来 自 具 常 系数 
的 高 斯 线性 随机 过 程 这 一 零 假设 ,因此 可 以 认为 时 间 序 列 来 自 的 系统 不 具有 非 线 
性 特征 ,与 实际 情况 一 致 。 

零 假 设 2: 时 间 序列 来 自 具 常 系数 的 高 斯 线性 随机 过 程 经 过 单调 静态 非 线 性 
变换 。 

利用 2. 5.1 节 中 迭代 的 幅度 调节 Fourier 变换 (IAAFT) 方 法 生产 19 组 替代 
三 变量 时 间 序 列 , 经 计算 ,线性 元 余 的 显著 性 检验 统计 量 DIFFL Ein Lente Pan) 
关于 时 间 延 迟 间 隔 + 的 函数 如 图 3.14(a) 所 示 , 广 义 元 余 显著 性 检验 统计 量 
DIFFR, Gri 2265254238 F BR B] SEGR [8] E c 的 函数 如 图 3. 14(b)(9 一 1)、 图 3. 14 
(c) (gq 二 2) 和 图 3. 14(d) (q—3) BR. 

线性 边缘 元 余 ACzi;Tz.n+r;Za.n) 与 广义 边缘 元 余 Pel Tini Etnii Tan) BU SERE 
性 检验 统计 量 DIFFAC 21 ni Tonteri Lsn) A IDFF o Gris irasci HE 3.15 所 示 。 

可 见 , 线 性 元 余 的 显著 性 检验 统计 量 都 很 小 ,这 表明 原 时 间 序 列 与 替代 时 间 序 
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$15 零 假设 2 下 线性 边缘 元 余 和 广义 边缘 元 余 的 显著 性 检验 统计 量 
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列 的 线性 依赖 结构 没 明 显 差 异 , 即 生成 的 替代 时 间 序 列 是 好 的 .同时 广义 宛 余 的 显 
著 性 检验 统计 量 的 值 几乎 都 小 于 1. 96, 即 不 能 有 效 地 拒绝 时 间 序 列 来 自 具 常 系数 
的 高 斯 线性 随机 过 程 经 过 静态 非 线 性 变换 这 一 零 假设 ,因此 可 以 认为 时 间 序 列 来 
自 的 系统 不 具有 非 线性 特征 ,与 实际 情况 一 致 
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在 实际 问题 中 ,一 个 复杂 系统 往往 是 由 多 个 状态 变量 描述 的 ,因此 ,通过 观测 
或 者 实验 可 以 从 不 同 的 角度 获得 多 维 的 观测 结果 ,这 些 离散 的 观测 量 在 时 间 轴 上 
形成 一 组 多 变量 时 间 序 列 。 例 如 对 生理 学 中 的 心脏 这 个 复杂 动力 系统 ,心电图 是 常 
用 的 观测 数据 ,目前 广泛 采用 8 路 或 者 16 路 探头 形成 多 维 输出 ,从 不 同 的 角度 对 
心脏 的 动力 系统 进行 观察 .对 于 证 券 市 场 这 个 复杂 动力 系统 ,如 果 把 每 只 股票 作为 
一 个 观测 量 , 则 证 券 市 场 同 一 时 刻 产 生 的 观测 数据 多 达 几 百 维 。 原则 上 ,对 自治 系 
Bt IRR F. Takens 的 延迟 嵌入 定理 ,只 要 嵌入 维 数 足够 大 , 单 变量 时 间 序列 足以 
重 构 原 动力 系统 ,但 在 实际 问题 中 ,情形 不 完全 是 这 样 。 例 如 , 式 (1. 6) 的 Lorenz 系 
统 中 利用 c 坐标 可 以 较 好 地 重 构 原动力 系统 ,而 利用 < 坐标 就 不 能 很 好 地 重 构 原 
动力 系统 "中 。 因 此 ,不 能 保证 实际 问题 中 任何 获取 的 单 变量 时 间 序 列 都 能 较 好 地 
重 构 原动力 系统 ,特别 在 具有 噪声 的 观测 时 间 序 列 中 ,利用 多 变量 时 间 序 列 重 构 可 
以 获得 比 单 变量 时 间 序 列 重 构 更 好 的 结果 。 另 外 ,对 比较 短 的 观测 时 间 序 列 , 利 用 
多 变量 时 间 序 列 重 构 可 以 弥补 时 间 序 列 长 度 不 足 的 问题 。 


4.1 多 变量 时 间 序 列 相 空间 重 构 的 流程 


假设 从 复杂 系统 中 通过 观测 或 实验 手段 获得 一 组 多 变量 时 间 序 列 , 首 先 需 解 
决 的 问题 是 这 些 变量 是 否 都 需要 。 显 然 ,对 某 些 复杂 系统 ,可 以 从 不 同 的 角度 和 用 
不 同 的 实验 方法 获得 多 个 变量 的 时 间 序 列 ,但 某 两 个 变量 的 时 间 序 列 之 间 可 能 是 
相互 依赖 的 ,或 者 说 某 两 个 变量 的 时 间 序 列 可 能 反映 的 是 复杂 系统 的 同一 特征 , 那 
么 这 两 个 变量 的 时 间 序 列 只 需 考虑 一 个 即 可 ,否则 会 导致 信息 的 元 余 并 增加 计算 
的 复杂 程度 ,例如 ,把 一 个 病人 看 成 一 个 复杂 系统 , 则 通过 测量 病人 的 心电图 ,可 以 
获得 心 电 周 期 ( 即 两 个 连续 的 QRS 复合 波 中 R 波 之 间 的 距离 ) 时 间 序 列 ,也 可 获 
得 心率 变异 ( 即 心 电 周期 的 倒数 ) 时 间 序 列 , 还 可 以 获得 两 个 连续 的 QRS 复合 波 中 
R 波峰 间 波 形 曲线 下 的 面积 时 间 序 列 及 R 波峰 间 波 形 曲 线 长 度 时 间 序 列 等 ,显然 
这 些 时 间 序列 都 是 反映 病人 的 心脏 异常 情况 的 ,研究 其 中 一 个 时 间 序 列 即 可 。 

从 另 一 个 角度 看 ,复杂 系统 通常 分 解 成 几 个 子 系统 进行 研究 ,假设 从 每 一 子 系 
统 通 过 观测 或 实验 各 获得 一 组 单 变 量 时 间 序 列 ,组 成 整个 复杂 系统 的 一 组 多 变量 
时 间 序 列 , 要 解决 的 问题 是 这 些 变量 是 否 都 需要 ,或 者 说 这 些 子 系统 是 否 是 完全 独 
立 的 ?如 果 一 组 单 变 量 时 间 序 列 完全 依赖 于 另 一 组 单 变 量 时 间 序 列 , 即 一 组 单 变量 


E 


第 四 章 ”多 变量 时 间 序 列 相 空间 重 构 Une 


时 间 序 列 可 由 另 一 组 单 变量 时 间 序 列 预 测 或 它们 之 间 存 在 一 个 映射 关系 , 则 这 组 
单 变 量 时 间 序 列 是 多 余 的 ,在 多 变量 时 间 序 列 的 重 构 中 ,这 样 的 时 间 序 列 可 不 

因此 , 当 我 们 通过 观测 或 实验 手段 获得 实际 问题 中 的 复杂 系统 的 多 变量 时 间 
序列 后 ,首先 需要 研究 的 问题 是 这 些 变量 的 时 间 序 列 之 间 是 否 有 某 种 依赖 关系 ,如 
果 某 一 变量 的 时 间 序 列 依赖 于 另外 一 些 变量 的 时 间 序 列 , 则 在 研究 相 空间 重 构 时 
可 以 去 掉 , 这 样 逐 一 处 理 后 可 以 得 到 一 组 相互 独立 的 多 变量 时 间 序 列 。 

多 变量 时 间 序 列 相 空间 重 构 最 早 的 重 构 方式 比较 简单 ,就 是 每 一 变量 作为 重 
构 的 多 维 空间 中 的 一 个 分 量 , 重 构 空间 的 维 数 与 变量 个 数 相等 ,与 延迟 时 间 无 关 ， 
这 样 做 的 好 处 就 是 避免 了 重 构 参数 的 选取 问题 ,但 当 测 量 的 变量 个 数 小 于 原动力 
系统 的 实际 维 数 时 ,这 样 做 显然 会 失去 某 些 信息 , 重 构 的 空间 不 等 价 于 原动力 系 
统 . 为 了 能 从 多 变量 时 间 序 列 通过 延迟 嵌入 方法 重 构 相 空间 ,需要 讨论 延迟 时 间 间 
隔 和 区 入 维 数 的 确定 方法 ,但 与 单 变 量 时间 序 列 相 比 , 重 构 参 数 的 确定 会 更 困难 ， 
因为 这 时 延迟 时 间 间 隔 和 嵌入 维 数 分 别 有 多 个 ,而 不 是 各 一 个 。 

相 空间 的 嵌入 维 数 是 系统 复杂 性 的 一 个 界 , 这 种 拓扑 维 数 一 般 情况 下 只 是 吸 
引子 占据 空间 数量 的 一 个 非常 粗糙 的 描述 ,为 了 给 出 更 严格 的 描述 ,有 不 少 不 同 的 
维 数 概念 ,其 中 关联 维 数 是 最 常用 的 一 种 维 数 度量 ,尤其 对 观测 或 实验 获得 的 时 间 
序列 ,可 由 G-P 算法 直接 计算 。 关联 维 数 度量 了 研究 系统 的 复杂 性 ,刻画 了 相 空 间 
中 点 的 分 布 , 在 确定 性 系统 中 ,关联 维 数 就 是 生成 相应 系统 所 必须 的 独立 变量 的 个 
数 ,规则 的 确定 性 系统 有 整数 关联 维 数 , 而 混沌 系统 有 非 整数 关联 维 数 ,大 于 此 关 
获 维 数 的 下 一 个 整数 就 是 系统 的 独立 变量 的 个 数 。 如 何 从 多 变量 时 间 序 列 重 构 的 
相 空 间 中 计算 关联 维 数 是 需要 进行 研究 的 问题 。 
在 动力 系统 分 析 中 ,Lyapunov 指数 是 一 个 十 分 重要 的 概念 ,一 个 非 线 性 系统 
的 全 部 Lyapunov 指数 称 为 该 系统 的 Lyapunov 指数 谱 , 它 与 初始 状态 无 关 , 在 拓 
扑 映射 下 不 变 , 是 复杂 系统 刻画 和 分 类 的 重要 指标 。 最 大 Lyapunov 指数 定量 地 刻 
了 初始 靠近 的 状态 空间 轨 线 的 指数 发 散 率 ,特别 最 大 Lyapunov 指数 为 正 是 混 
沌 的 重要 特征 。 因 此 如 何在 多 变量 时 间 序 列 中 有 效 地 计算 Lyapunov 指数 也 是 需 
要 研究 的 问题 。 

综 上 所 述 ,多 变量 时 间 序列 相 空 间 重 构 的 流程 可 以 用 图 4. 1 表示 。 

多 变量 观测 时 间 序 列 中 往往 包含 比 单 变量 观测 时 间 序 列 更 丰富 的 关于 观测 系 
统 的 信息 ,因此 ,对 多 变量 时 间 序 列 进行 相 空 间 重 构 可 以 更 好 地 获取 观测 系统 的 特 
征 和 演化 行为 ,通过 在 重 构 的 相 空 间 中 计算 几何 不 变量 ,可 以 分 析 、 解 释 、 指 导 实际 
系统 ,因此 ,这 时 有 许多 问题 需要 进一步 进行 研究 。 
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实际 问题 中 的 复杂 系统 
—— — 
通过 观测 或 实验 


多 变量 时 间 序列 


ERES 
有 依赖 关系 ? 


是 


两 两 独立 的 多 变量 时 间 序 列 


计算 几何 不 变量 


图 4.1 多 变量 时 间 序列 相 空间 重 构 的 流程 图 
4.2 多 变量 时 间 序 列 中 变量 间 的 依赖 关系 


通过 观测 或 实验 获得 的 多 变量 时 间 序 列 中 各 观测 变量 之 间 可 能 存在 一 定 的 相 
关 性 ,如 何 剔 除 其 中 的 宛 余 数据 ,寻找 能 够 反映 动力 系统 演化 特征 的 数据 是 首先 需 
要 解决 的 一 个 问题 。 

对 实际 问题 中 的 复杂 系统 ,可 以 根据 问题 的 实际 意义 对 获得 的 K 个 变量 的 时 
间 序列 进行 分 类 ,分 成 工 个 子 集 ,下 面 主要 研究 子 集 1, 中 的 一 个 时 间 序 列 是 否 依 
MER K,—1 个 时 间 序 列 这 一 问题 。 

假设 {z) 六 :和 {yoj-; 分 别 是 某 一 复杂 系统 的 两 个 子 系统 X 和 了 通过 观测 或 
实验 产生 的 时 间 序列 ,如 果 它 们 在 统计 上 是 依赖 的 , 称 子 系统 X ALY 是 耦合 的 ,这 
意味 着 可 以 从 子 系统 Y 中 获取 子 系统 X. 的 某 些 信息 ,反之 亦 然 。 测 量 两 个 平稳 时 
间 序 列 间 统 计 依 赖 性 的 最 基本 的 方法 是 正 交 关联 函数 法 ,这 种 方法 的 优点 是 计算 
简单 方便 ,但 它 只 能 测量 线性 依赖 性 ,无 法 测量 非 线 性 依赖 性 ,虽然 也 可 用 高 阶 正 
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交 函 数 测量 非 线性 依赖 性 ,但 计算 变 得 复杂 多 了 。 在 非 线性 时 间 序 列 分 析 中 ,互信 
息 法 是 测量 统计 依赖 性 的 一 种 常用 方法 , 当 X 和 了 耦合 时 ,它们 之 间 有 公共 的 信 
息 , 这 种 公共 信息 的 多 少 可 以 由 {zx,)*2!1 和 {y,)*-! 之 间 的 互信 息 来 度量 。 当 子 系统 
和 X 和 了 没有 耦合 时 ,意味 着 X MY 之 间 没 有 公共 信息 , 即 互 信息 为 零 , 此 时 从 统 
计 意 义 看 从 给 定 的 {y,)*-! 不 能 获得 {z,}*- 的 信息 ,反之 亦 然 ,表明 此 时 获得 的 这 
两 个 时 间 序列 是 独立 的 ; 当 子 系统 X 和 Y 有 最 大 耦合 时 ,意味 着 两 个 子 系统 之 间 
有 确定 性 关系 ,此 时 ,几乎 对 所 有 的 n,{y,) 江 1 是 {z.) 代 ,的 函数 ,反之 亦 然 ,在 这 种 
情况 下 ,表明 其 中 一 个 时 间 序 列 是 多 余 的 ,因此 ,在 整个 复杂 系统 的 研究 中 , 当 两 个 
子 系统 具 最 大 耦合 时 ,只 需 考虑 其 中 一 个 即 可 。 由 此 看 来 ,互信 息 可 以 认为 是 两 个 
系统 耦合 强度 的 一 种 度量 ,能 较 好 地 反映 两 个 系统 的 耦合 情况 ,但 它 的 计算 比较 麻 
烦 , 需 用 直方 图 的 方法 求 分 布 密度 函数 ,为 了 克服 这 一 困难 ,文献 [104,105] 提 出 用 
广义 互信 息 测量 统计 依赖 性 的 方法 ,但 要 求 其 中 一 个 时 间 序 列 满足 一 致 分 布 , 否 则 
要 通过 复杂 的 转换 才能 使 用 。 我 们 对 文献 [104,105] 中 的 方法 做 了 改进 和 推广 , 提 
出 了 一 种 新 的 统计 依赖 性 测量 方法 ,这 种 方法 不 需要 预先 假设 时 间 序 列 满足 一 致 
Ap Api oe 7) | 


42.1. 随机 变量 间 统 计 依赖 性 的 度量 方法 


设 ,7 分 别 是 密度 函数 为 p.(z) ,pa(y) 的 两 个 随机 变量 ,C$,7) 的 联合 密度 函 
数 为 pO ,定义 6 的 正 交 关 联 函数 为 


Cor(e,7) = fan a.) 
a 


sth ENEN A MERELE E) 6,0 的 均值 yceyo SPH RE BA BL AR E 6m 的 标准 
HE. CorCE p =0 的 充分 必要 条 件 是 与 7 在 统计 上 不 关联 ,定义 $,7 的 互信 息 为 
T(E,D= HG) 十 HO) — HG 


a p(tsy) 
[Joc vlog, — rt drdy (4.2) 
其 中 
HG) —— [pi GOlogipi Gods (4.3) 
Hop =— [plog ody (4.4) 
HEM =— [pce ylogiperyddedy (4.5) 
4} 9d C£) .€,7 的 Shannon Ji. AMEE RA: 
0& IC) < min( HE), HD) (4.6) 


H IG =0 的 充分 必要 条 件 是 6,9 在 统计 上 独立 , 即 pri) = pi GO ps(y); 
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— 6( 或 统计 上 依赖 
TD. 
Het UL HR) BK K 39 7 E BY E T8] JI Gc TL F {yn bh CFR TE B ERE E T ERI 
用 直方 图 计算 其 密度 函数 ,计算 过 程 比较 麻烦 。 为 了 解决 这 一 问题 ,文献 [104， 
105] 提 出 了 用 Renyi #404 Shannon Wi MHA: 
I, -— HG) + HM — HG) 


p Gy)dzdy 


= log; (4.7) 
Joins | pray 
其 中 
Hy) =— log:| macz)dz (4.8) 
H =— loge) piy (4.9) 
HG. 一 一 log: [7e y>dzdy (4.10) 


A Hl de (E49) 8, HY Renyi Hi. 

这 一 方法 的 优点 是 对 观测 或 实验 产生 的 时 间 序 列 ,计算 Renyi 88 HBL HM ,可 
用 关联 积分 来 计算 ,但 问题 在 于 1.($,7) 可 能 是 负 的 , 且 7z(6,7) 一 0 不 一 定 意 味 着 
$,7 在 统计 上 独立。 为 了 克服 这 一 困难 ,文献 [104,105] 中 要 求 6,7 中 有 一 随机 变 
量 服从 一 致 分 布 。 例 如 ,7 的 密度 函数 为 pa(y) 三 6, 则 7z(6,7) 成 为 


pi(r,y)dzrdy 


T,(€,9) = log; 
[ptc 


(4.11) 
此 时 
0<1,(€,9) < min(H;(G) H;Q)D) (4.12) 
H E= HY FEST BAR AEE 6,2 ESCH E THI IC 0) — HOO D Hq) J 
的 充分 必要 条 件 是 了 BET LE RRA ER E BEEP REF 7) 24 6,0 不 服从 一 臻 
分 布 时 ,文献 [105] 说 明了 可 通过 对 原始 时 间 序 列 作 相关 变换 ,使 它 成 为 一 致 分 布 ， 
并 证 明了 此 时 广义 互信 息 的 有 关 性 质 不 变 , 但 这 样 一 来 又 带 来 了 计算 上 的 困难 。 
为 了 能 对 任何 随机 变量 ,7 直接 应 用 ,我 们 定义 一 种 新 的 统计 依赖 性 度量 : 


Jee» — pix) p(y) Fdzdy 
ſetodæſolydo 


Tz (8,9) = log; +1 
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pr(r,y)drdy plrsy)pi(r)pa(y)drdy 
= log; 十 211 一 (4.13) 
Joicorde| pody feicords | poas 
SBIR 13 EDE IE (Eo) 0 BY FES ARE € 7 在 统计 上 独立 。 由 于 


[ecerdzdy= [jor ay] dx 


< || Joce.s04y) ‘ax = [zcodz (4.14) 


若 记 Premin = min (p(y) |yE 7) « Pemex max (p: Cy) |y € 7) + Ml 
pamn PKA < [oco GopiOndady < pes pix)dr (4.16) 
因此 可 得 17 CE s AY REAL Ten CE 089 — I EDU BD 


则 
2 ff perro coo onis 
foid 


1 
pi(y)dy 


T 


I; (§€,7) e| “a 


(4.15) 


\ 241 = 2 ps.nax eio ei 24 L—PPuss 
os⸗ [oas S Timx($,7) < loge [mm (4.17) 


H pros? Poss AL Pise ^ Be LT BLA KEERA A Pss Kl, 
甚至 prm 一 0。 当 观察 时 间 序列 足够 长 , 且 pzm 一 0 时 ,| Ps)dy 一 0, 因 此 


1 
Ine. ~ loge |? + [éco æ log; 


(4.18) 


— 
Joay 
同 理 , 当 pima 0 Bf 

— 
Joay 
另外 , 当 7 在 统计 上 依赖 于 时 ,对 某 个 y yGO ply) = pi a) Hh yéy 
(z) ,p(x,y) 三 0, 因 此 


2 [peo orco» 
I; (5,9) = log;|2 + zs (4. 20) 
[eicon» f pi GOdz [pi ody 


Ii.) ~ log; (4.19) 


1—2p2x 
IE 


由 于 poss pi (Y G2 < pus Hi BY 1 CE, 7) E log ü 
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2P2.min 


1=2f2.min 
log. |? + p; ZERA (&,7) 近 似 取 到 最 大 值 Toman (8 24 E ESET E 
foa 


依赖 于 7 时 ,可 同 理 讨论 。 
综 上 可 得 :0<12 EMSi mE) 而且 I2 (60) —0 的 充分 必要 条 件 是 与 
7 在 统计 上 独立 ; 当 7 在 统计 上 依赖 于 (或 在 统计 上 依赖 于 TDI Ic (6, 力 近似 
取 到 其 最 大 值 12, (E59) ,其 中 mE MARA. 18)[ 或 式 (4.19)] 近 似 估计 。 
注 : 当 了 服从 一 致 分 布 时 , 即 p(y) Se RE 


(x, y)drdy 


1; (8,9) = log; (4. 21) 


[piarde 
成 为 文献 [104,105] 中 定义 的 广义 互信 息 。 


4.2.2 观测 时 间 序 列 统计 依赖 性 的 计算 
1. 两 组 时 间 序 列 间 的 统计 依赖 性 


设 (zj 和 {?wj- 分 别 是 子 系统 X 和 了 Y 通过 观测 或 实验 获得 的 时 间 序 列 , 按 
RR Takens 的 延迟 嵌入 定理 ,分 别 做 以 下 相 空间 重 构 


Xn = Gar, e attemeos-pe)s R = Nay Na t+ Lye N 


N, = (m, — 1), +1 (4. 22) 
Y» = (Yn Innes Ya-na) nm Nyy Ny dunes N 
N, = (my — Dr, +1 (4. 23) 
Zn = (Ensue, stt Yan oor Ya Yar, nt nme oos n = NaN, + dues N 
N. = max{N,,N,} (4.24) 


KE BE BE oc, Cry) M mxz(my) 分 别 是 延迟 时 间 间 隔 和 嵌入 维 数 。 以 最 大 范 数 
| 。 M ws 定义 两 点 间 的 距离 ,以 下 为 简单 , 记 为 外 + ||. HEAR Takens 的 延迟 嵌入 
定理 ,确定 了 这 些 参数 后 ,状态 空间 一 x (或 yj。 一 y,+1) 的 演化 反映 丁子 系统 X 
(或 了 ) 的 演化 ,并 且 相 空间 中 吸引 子 的 几何 特征 与 原子 系统 X( 或 了 ) 中 的 几何 特 
征 等 价 。 
设 x, 和 yy 分 别 是 随机 向 量 $= CGE 06s AD I= Gne ,7m,) 的 实现 , 记 
Px,y) = prob(& = Tiset 一 zico pe rh = yp Nm, = jme) 
(4. 25) 
Pilz) = 3) pla, y) = probé, = zi, E, = zu ix) (4. 26) 


PAY) = Pplz,y) = prob{h = yj m, = Xie) (4. 27) 
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Xt zn M e BIE B., 分 成 一 系列 以 2e 为 边 长 的 超 立 方 体 。 考 虑 点 zi, 记 Buo Be th 
包含 = 的 超 立 方 体 。 假 设 e 充分 小 ,点 = 在 Bo 中 的 概率 pm 在 超 立 方 体 被 改变 
为 = f) e 邻 域 时 不 会 发 生 本 质 的 改变 , 则 此 概率 在 时 间 序 列 具 遍历 性 的 假设 下 可 
由 时 间 的 平均 估计 , 即 


ae — E 
«o ~ lim x N.a HE — lz- zl) (4. 28) 
0,7<0 
3p Hoo c (17g Heavside 函数 。 因 此 , 当 N-*eove-0 时 ,有 
1,220 
= 1 kal 
[rernm X Dee» De = Noa P 


1 
T"NTNXN-NGDAEPC- lasal 
= C, (4. 29) 
其 中 ps e Go y TES ¢ PE SLOT TR BY ER C. CZ e) RE Hz SR C4. 24) 重 构 的 相 空 
间 中 的 关联 积分 。 同 理 可 得 
[ima Y pico ~ NNN DH ssl) 


E 


=C,(X,€) (4. 30) 


1 
Cy dy HORS 
Jones Xo (N — NN =N, + DAE ly, — yD 
e 


= CQ.) (4. 31) 

进一步 , 若 对 xu oy, 分 别 作 < 前 分 Bie = (|n (B. ,分 成 一 系列 以 2e 

为 边 长 的 超 立方 体 , 考 虞 点 z， 它 的 投影 € By mein WE Bio WAR x; € Bi mein AE 
率 为 


æ li 1 s 
Piso ~ lim FLN, AH — xxl (4. 32) 
点 yE Bon BH 
i 
E 1 
^o) ^9 lim > H(e— loc ) (4. 33) 
Pamo ~ lim FLN, Pu ly; — yell 


因此 , 当 N-co,e>0 it, A 
[ozono oda» ~ 5 XI pne Goo 


x 
~ DP Pues = NON GM 


787 非 线性 时 间 序列 分 析 及 其 应 用 


1 
“(N — N. + 1D(N -NAN — N) 


N 


x3 D HE- de DHE ly— ml) 


IEN, jo N ni b= INL 


=K.(X,Y,Z,e) (4. 34) 
RP, pe pias Pr AE Gc y) exo y, 在 第 t 个 超 立方 体 Bim X Boss Bios Bon BY 
概率 。 

由 此 可 得 4. 2. 1 节 定 义 的 统计 依赖 性 度量 及 其 最 大 值 的 关联 积分 的 估计 , 即 

I (X,Y)= I2 È, 


" Ce 20 KjOGY Ze) 

- boa [cr near tl- edeesaue]] «39» 
RO= En ~ low d) 4. 36) 
132 XY) = R ED ~ og aw] ano 


2. 多 组 时 间 序列 间 的 统计 依赖 性 


i 01,2. LIBR FEF RHE Xi(1==1,2,…, 工 ) 通 过 观测 或 实验 获 
得 的 时 间 序 列 , 任 何 两 组 时 间 序 列 间 的 统计 依赖 性 可 由 上 面 的 方法 计算 .实际 问题 
中 有 可 能 出 现 以 下 情况 , 即 任何 两 组 时 间 序 列 在 统计 上 是 独立 的 ,但 其 中 一 组 时 间 
序列 (如 {zz.n)*%1,) 依 赖 于 其 余 工 一 1 组 时 间 序 列 [如 {zio)j*=:( 一 1,2, 沁 一 1)]， 
为 了 计算 这 种 统计 依赖 性 ,分 别 做 以 下 相 空间 重 构 
Xia 一 《ZLnsTLm-ayyTLo-tni-Dr) n = Nu Nub Mns N 

N,— (m — Dn +1 (4. 38) 

Zlin = Cia eia 1 Einm on 9 Lon npn Te mg Dn Yt 
"—— ——— io -heat Da iD) 
n= NP NP lys. Ns NP max (m— Dy 十 1 (4.39) 

7m 
Za = (Thy Than Sia ono Dr spa Laney "Tan ms Dr 
Len (n7 De 211 EL Tht Zhan (nio) 


n = NP NP dons Ns NP = maxOn — Dr +1 (4. 40) 
IL 


Ji] SAUL Br KITE , 88 8] FE P {nS RR LAI Muf TEI cni C 
三 1,2,…, 上 一 1) 的 统计 依赖 性 度量 及 其 最 大 值 的 关联 积分 的 估计 , 即 
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IH (Xi ye X11 5X1) 


~ loa a sed on + 17 — Em D] «1 
138 OG Xia X0 ~ log eros] 4.42) 
IR Xi XXa) ~ logs ag) (4. 43) 
其 中 
C9 = WONNEN DAH — xm xl) — 0.40 
C Za = ND He Mes sel) 


xj 


(4. 45) 


Ce = WoNPWONP ED Me — Iz — zl) (4.46) 


i 


KyOGZ, s Zi, = 


1 
(N — Nf? -- DXOVN — NON — NP) 
A 
x23 2. Ale Ween Hh) Hle— Nez al) (447 


i NE jm NL ba ND assi 


42:3 AMD 


例 4.1 设 随 机 向 量 (#,3) 的 联合 分 布 密度 为 puo — +20— Ps Pa => — 


Pe pum put y — b PB 15 < p< 1L BU € AERIS BOR AE ps 
=putpu=prpe= pat Pal p. HU 


1 T 2 
LG. =los,{ (4 = 如 3 1 — pyrtpg-t l zd e 
pe i — 
x[- ies: m (4. 48) 
LG, 一 0 (4. 49) 
5 Lass, 2 — 12p + 32h? — 40p? + 20p* 
I; (6,9) —log, 1— 4p + 8p — Bp! F 4p (4. 50) 


BEALE pm ER pum ppoi sj 12,8 € 55 7 EB LARS EAT XC 
互信 息 无 法 检测 到 ps RECS SEROMA, C) = 0.17 Gp = 0 的 充 
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分 必要 条 件 是 /一 去 ,因此 互信 息 和 4. 2.1 节 定 义 的 统计 依赖 性 度量 能 很 好 地 检 


测 到 p 关 十 时 《与 7 的 统计 依 闲 性 。 


例 4.2 设 随机 向 量 ($,7) 的 联合 分 布 密 度 函数 为 
12-8, G.») € ([0,0.5] x [0,0.5] U ([0.5.1] x [0.5,1]) 
biGr y) -f — ð, (x,y) € ([0,0.5] x [0.5,1]) U ([0.5,1] x [0,0. 5) 
0,30 € 其 他 
(4.51) 


则 pi GO m p) 71,6 COLERA OEE Em 1 > EROS 
eco T E) 1+ Lo piti sain tos 


V 
Cor(£,) = io (4. 52) 

计算 可 得 
ip CLE Die D — a — dlog — à) d: 
I,G,7) = log; + 6°) (4.54) 
I: (£, = logz(1 + 8°) (4.55) 


当 6=1 Bh Cort m = S6 D Om LG IE (Gp =1 都 取 到 最 大 值 ， 


MF a= Cor E BUE Ls Eom) DG (1 (6,7) 都 是 CorC&,7) 的 函数 .在 这 个 
特殊 的 例子 中 ,,7 在 统计 上 独立 的 充分 必要 条 件 是 ,7 不 关联 。 但 由 于 任何 两 个 


随机 变量 的 互 关联 函数 不 会 超过 1 因此 立 是 一 个 相当 大 的 值 ,表明 具有 较 强 的 关 
联 性 ,而 对 E, IOS Geop ,它们 的 取 值 在 0 到 十 co 之 间 ,1 是 一 个 非常 
小 的 值 ,表明 此 时 非 线 性 统计 依赖 性 不 强 。 这 个 例子 说 明了 《与 7 关联 性 较 强 , 即 
线性 依赖 性 较 强 ,但 非 线性 依赖 性 较 弱 。 
例 4.3 考虑 下 面 的 耦合 Henon 映射 
ERA 一 1 一 1.4z + 0. 3u, Cs 
Maxi = X. 
y, p = 1— 1.4[Czx, + (1 — C)y,]y, + 0. 3v, 
Veri = Yn 
SEPA GRE C 在 0~1 之 间 。 取 初始 点 10 — O, yo 9 — 1 ENG 2024 个 点 ， 
去 掉 前 1000 ^r 2 FRET DFA (2. A ya doni o 
图 4. 2 一 图 4. 4 给 出 了 耦合 强度 C 分 别 为 0. 1,0. 65,0.9 时 ,rr-y 关系 图 ,从 


(4.57) 
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图 4. 2 一 图 4. 4 中 可 以 看 出 , 当 C=0.1 时 ,几乎 没有 耦合 ,而 当 C 一 0.9 时 ,产生 了 
几乎 完美 的 耦合 。 


图 4.2 C=0.1 B} z-y 关系 图 


图 4.3 C=0.65 时 zi-y 关系 图 


2 -05 0 os 1 
x 


图 4.4 C=0.9 Ft z,- y, 关系 图 
图 4.5.8 4.6 和 图 4.7 分 别 给 出 了 C=0.1,0. 65,0.9 HY, AK C4. 35), 
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RA. 36) 和 式 (4. 37) 计 算得 到 的 统计 依赖 性 度量 12 (X,Y) 及 它 的 最 大 值 a 
(X,Y) 或 12:2 OC Y) B m =m, =3,r —7,—1,€ PHM 2 ,8—0,1, 7,10, 


图 4.5 C=0.1 时 Ji-e 关 系 图 ,从 上 到 下 的 曲线 分 别 为 
Tia (XY) Ti OGYYR 1: (X,Y) 


图 4.6 C=0.65 时 12-e 关 系 图 ,从 上 到 下 的 曲线 分 别 为 
IICA (XY) 1S XY) A? (X,Y) 

从 图 4.5 可 知 ,只 要 e 不 是 太 小 ,五 XY ILE AE, E (X,Y) 明 显 小 于 
Hass (X Y) ,表明 此 时 {zt 和 (ys) 统计 上 几乎 独立 , 即 系统 和 YY JU S8 
合 。 从 图 4.7 可 知 ,IT? (X,Y) 几 乎 等 于 Iss (XY) RIER hA y eiei 
上 相互 依赖 , 即 X 和 Y 几乎 耦合 。 图 4. 6 的 情况 介 于 图 4. 5 和 图 4. 7 的 情况 之 间 ， 
I (X,Y 了 ) 小 于 Hs OG YO {E 12 (X,Y) 对 任何 e 都 不 为 零 ,表明 此 时 {zx,)! 
{yo} 过 {统计 上 不 独立 ,但 它们 的 统计 依赖 性 也 不 是 最 强 , 即 X0 Y ERA (BR 
合 强度 不 是 最 大 。 以 上 结果 与 图 4. 2、 图 4. 3 和 图 4. 4 的 情况 完全 一 致 ,表明 提出 
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T —- 
02 04 06 08 1 
B 


图 4.7 C=0.9 时 及 -关系 图 ,从 上 到 下 的 曲线 分 别 为 
Tine (XY) 12:2 (XYM Ii OXY) 


的 统计 依赖 性 度量 方法 对 这 一 例子 是 完全 有 效 的 。 


4.3 多 变量 时 间 序 列 相 空间 重 构 参 数 的 确定 


假设 从 复杂 系统 中 获得 K 个 变量 的 时 间 序 列 ,我 们 把 它 分 成 工 个 子 集 , 即 I, 
Toye sis FRL 中 含有 KK 个 变量 的 时 间 序 列 ,L==1,2,…, 工 , 则 Ki 十 Kz 十 … 十 Ki 
二 KK。 如 果子 集 L 中 的 一 个 时 间 序 列 依赖 于 其 余 K, 一 1 个 时 间 序 列 , 则 从 PR 
需 取 一 个 时 间 序 列 即 可 ,这 样 可 构成 L(L<K) 个 变量 的 两 两 独立 的 时 间 序 列 。 

FHRA LAE HR AY PS POR SE BS SE TI EPI n. Sy 0 — 1,2, DD ERE L 
个 连续 变量 n0) (=1,2,…, 工 ) 的 测量 值 , 即 ra= 21 (tot nt) (n= 1,250 NGL 
—1,2,7L) rb to REGIS Ar 是 样本 时 间 。 

早期 对 多 变量 时 间 序 列 的 研究 ,都 是 在 最 简单 的 重 构 方式 下 讨论 的 , 即 每 一 变 
基 作 为 重 构 的 多 维 空间 中 的 一 个 分 量 , 重 构 空间 的 维 数 与 变量 个 数 相 等 ,与 延迟 时 
间 无 关 , 这 样 做 的 好 处 就 是 避免 了 重 构 参数 的 选取 问题 ,这 方面 的 工作 可 见 文献 
[102,108~111], 但 当 测量 的 变量 个 数 小 于 原动力 系统 的 实际 维 数 时 ,这 样 做 显然 
会 失去 某 些 信息 , 重 构 的 空间 不 等 价 于 原动力 系统 。 文 献 [102] 猜 测 最 佳 幅 入 可 能 
是 某 些 变量 和 某 些 时 间 延 迟 的 组 合 ,为 此 后 来 在 研究 多 变量 时 间 序 列 的 预测 时 , 文 
献 [112] 提 出 了 多 变量 时 间 序 列 延迟 重 构 的 思想 ,做 以 下 时 间 延 迟 相 空 间 重 构 


Xy = (Eins Zine t" Tinim Da FEza s Trace 98 Tzn (mg— Dr 
S — vtt XL on 708) 


n = NoNo +1,0, N 
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No = max { (m 一 Dat 1} (4. 58) 
SEB .n-1,2, LD m —1,2,7 LL) SPH BQ AS ER Bh [8] [8] BB A XA EL, IS 


L 
似 于 F. Takens 的 延迟 嵌入 定理 ,只 要 m 或 m= V m 充分 大 ,存在 映射 G:R" 一 
R”, {Ë 
Xn = GG) (4. 59) 
也 可 以 写成 以 下 等 价 形式 : 
intr = GX) L= 1,2 L (4. 60) 
此 时 状态 空间 x 一 x,+1 的 演化 反映 了 原 未 知 动力 系统 的 演化 ,这 意味 着 原动力 系 
统 吸 引子 的 几何 特征 等 价 于 重 构 的 m 维 状态 空间 中 吸引 子 的 几何 特征 ,因此 原 动 
力 系 统 中 任何 微分 或 拓扑 不 变量 可 以 在 重 构 的 状态 空间 中 计算 。 
与 单 变量 时 间 序 列 相 空间 重 构 一 样 ,R" x, 到 xj 的 距离 记 为 | x, —x, || AT 
以 由 工 ; R LME. 
在 按 式 (4. 58) 重 构 后 ,面临 的 问题 是 如 何 选取 延迟 时 间 间 隔 5(l1=1,2,… L) 
TUA BERL m Q— 1,2, 7L) ,使 式 (4. 59) 或 式 (4. 60) 成 立 。 
在 多 变 基 时 间 序 列 中 ,由 于 变量 之 间 的 性 质 不 同 , 反 应 在 数值 上 差异 可 能 比较 
大 ,因此 延迟 重 构 参 数 5 的 选取 采用 单 变 量 时 间 序 列 中 的 方法 , 即 对 每 一 个 分 量 
时 间 序 列 {zi.,) 代 1, 分 别 确定 mn, 具体 可 以 用 第 二 章 中 的 自 关 联 函 数 最 小 法 或 互信 
息 最 小 法 等 方法 确定 ,而 嵌入 维 数 m 的 确定 比较 复杂 ,下 面具 体 讨论 几 种 确定 幅 
入 维 数 的 方法 。 


4.3.1 ”利用 预测 误差 最 小 法 确定 嵌入 维 数 


预测 误差 最 小 法 是 L. Y. Cao 等 在 文献 [112] 中 提出 的 ,后 来 文献 [113] 也 利 
用 了 这 种 方法 。 其 基本 思想 是 利用 式 (4. 59) 中 的 映射 G 或 式 (4. 60) FAY GG —1, 
2,…',) 的 连续 性 。 由 于 不 同 的 G 可 能 需要 不 同 的 最 小 戏 入 维 数 (例如 Lorenz 系 


统 中 ,至 只 依赖 于 z 和 y 但 不 依赖 于 =, 而 和 依赖 于 z、y 和 =), 因 此 实际 计算 中 考 
BRU. 60) 中 的 Ge EWE, HF G 的 连续 性 , 当 m 为 合适 的 嵌入 维 数 时 , 若 xn 
与 总 充分 靠近 , 则 zn+1 与 zj+1 也 将 充分 靠近 。 

对 已 确定 的 时 间 延 迟 间隔 .C1 二 1,2,…, 工 ) 及 任意 给 定 的 嵌入 维 数 m=, 
2,7 L) , 按 式 (4. 58) 重 构 向 量 x,, 设 x, 的 最 近邻 点 为 xxw, 即 

| x, — xw» l| = mint lx, — x; || :j= No Noc 1e Nj n) (4.61) 
定义 下 面 的 一 步 预 测 误差 

x 

= NON TI [zie — Zigmsi| C4. 62) 


n=No 


EGny mz, mz) 
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对 于 较 小 的 mi,mz,…*mz, 由 于 没有 合适 地 嵌入 ,预测 较 差 ,所 以 EGn mess 
mz) 较 大 ; 当 mi mi mu 增加 到 合适 的 嵌入 所 需 的 最 小 值 时 ,由 函数 Gi 的 连续 
TE E Gni mi i mi) 减少, 如果 系 统 有 正 的 Lyapunov 指数 及 噪声 , 则 继续 增加 
mi misi mz 会 使 E Cony mis mi) tL AE HD ER Ub RT XE UE E Om sme, 
mz) 最 小 的 那 组 my mint ,mz FRA HEC BD 


L 
(m mi mr) Sarg min {E (m, mi, mi) | 6m m; ,mj) EZ", 31m #0} 
a 


(4. 63) 


式 中 , z'- I z.z 表示 所 有 非 负 整数 。 

注 ， 

D 代替 一 步 预测 误差 式 (4. 62) ,可 以 定义 最 大 误差 或 均 方 根 误差 。 

2) 代替 利用 最 近邻 点 (局 部 常数 ) 定 义 一 步 预 测 , 也 可 以 定义 多 步 预 测 或 其 他 
预测 ,然后 再 定义 预测 误差 。 但 用 最 近邻 点 定义 的 一 步 预 测 计算 快速 简便 , 且 不 需 
要 估计 参数 。 

3) 实际 应 用 中 ,可 限定 在 某 一 范围 内 搜索 使 (ma ma s mi XS UR M 
入 维 数 , 即 先 确定 某 一 最 大 维 数 Do, 考虑 

(mt mi mi) —arg min(EGn mi, mi) 


A 
o m, < Daxil = 1,25, L, Dm 30]. (4.64) 


fei 


4.3.2. 利用 虚假 最 近邻 点 法 确定 媒人 维 数 


在 单 变量 时 间 序 列 相 空 间 重 构 中 ,虚假 最 近邻 点 法 是 一 种 比较 理想 的 确定 风 
入 维 数 的 算法 ,我 们 在 文献 [114] 中 把 这 种 算法 推广 到 了 多 变量 的 情况 。 

3 x, 的 最 近邻 点 为 xxw，, 即 

l| x, — xg l| mmm? = mint || x, — x; |) t j = No Nod dem Nn) 
(4. 65) 

当 维 数 从 m 增加 到 m+ 1 时 ,如 m, 变 为 mH, RUE 1127 [8] AY FE BS EY |] xz, 一 zoom 
[Graeme ben) BE Jp xs xo | mmm? Be || x. x» | menm KRE, 
可 以 认为 是 由 于 高 维 吸 引子 中 两 个 不 相 邻 的 点 在 投影 到 低 维 轨 线 上 时 变 成 相 邻 的 
两 点 造成 的 ,因此 这 样 的 邻 点 是 虚假 的 。 具 体 地 说 , 当 


i 
a mae Et pie em 
BE ay ax, 的 虚假 最 近邻 点 。 


对 实测 时 间 序 列 ,rap… ,mp… mz) 从 (1，…,1,…,1) 开 始 ,每 次 mi 增加 1， 
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直到 虚假 最 近邻 点 的 比例 小 于 某 个 3 或 虚假 最 近邻 点 不 再 随 着 m 的 增加 而 减少 
时 ,可 以 认为 吸引 于 几何 结构 完全 打开 ,此 时 的 (ma，… ,mi，,… ,m1) 为 嵌入 维 数 。 根 
据 经 验 通 常 取 定 义 Rr€E[10,50],6=5%。 

上 述 算法 中 的 两 个 关键 阔 值 参数 Rr 和 6 对 整个 算法 的 性 能 和 有 效 性 十 分 重 
要 。Rr 用 来 判别 邻 点 是 否 为 虚假 ,过 大 的 选择 会 造成 无 法 发 现 虚 假 邻 点 ,而 过 小 的 
选择 却 又 会 受到 时 间 序 列 中 噪声 的 干扰 ,因此 选择 合适 的 Rr 是 一 个 较 困 难 的 问 
题 ,6 是 用 来 标记 虚假 邻 点 率 的 ,理论 上 3=0 表示 所 有 虚假 邻 点 的 消失 ,但 是 实际 
上 由 于 时 间 序 列 在 观测 过 程 中 受到 噪声 的 干扰 $ 无 法 收敛 到 0, 因 此 多 凭借 经 验 
根据 观测 时 间 序 列 质量 的 好 坏 预 定 一 个 疮 值 。 


4.3.3 ”虚假 最 近邻 点 法 确定 嵌入 维 数 算法 的 改进 


针对 虚假 最 近邻 点 算法 的 不 足 ,我 们 在 文献 [115] 中 给 出 了 一 个 更 加 实用 的 改 
进 算法 ,避免 了 阅 值 参数 选取 的 主观 性 。 

XE L RR HEEL ſa FEB (1,125119 1,2, 7L PE C4. 58) 的 相 空间 重 构 , 设 zx 的 
最 近邻 点 为 xw BP 

| x, — xw» — min{ lx, — x; l| tj= NoNo + 1st NsjsEn) (4.67) 
定义 

eGsmi sumi sm) 

i» | x, Gm; vt mi 1 mu) m3àyo) Qni s mil, mi) |l 


— x 
|| x, Gmy y mist mp) — Xgoy (m y mis mi) | (498 


X n— No,No 十 1,…,N, 进 一 步 定 义 


N 
EGn, mimm, = N—NG MeGnim nm mss mr) (4.69) 


ES 
记 集合 

Um) = (EGmn me ymin) [my domi + m, =m} (4.70) 
且 定义 


E(m) = EGmn, mi, ym) (4.71) 


1 
IU Gn) Vas, E oet 
p IU Gn) | EM U GrO BEES TORN IK. HT REN HAE » EL 


E(m +1) 
Eon) (4. 72) 


如 果 m> mo Bt (Ei Gn) 3E ER LU mo 十 1 为 整个 重 构 的 相 空 间 的 嵌入 维 数 。 进一步 计 
HIE Emo omo m Bo MER) my emi eom mp BP 


Ent ,. m) so smi) 


E\(m) = 
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= min(EGmn, mi, mi) |EGm mim) € Ulmo +1)} (4.73) 
则 m? ,… ,m2 see mz Eh L RETF (rir L=1,2. L BASS 
BF EAH RA ER. 

该 算法 可 以 在 计算 全 局 相 空间 重 构 维 数 的 过 程 中 ,同时 计算 各 独立 系统 的 局 
部 相 空 间 重 构 维 数 。 由 于 简单 的 虚假 邻 点 算法 在 计算 嵌入 维 数 时 ,使 用 了 固定 的 距 
离 判别 参数 Rr ,无 法 适应 数据 异常 波动 的 情况 ,特别 是 当时 间 序 列 中 含有 噪声 信 
号 时 Rr 的 选择 非常 困难 ,针对 这 个 缺陷 ,改进 算法 通过 使 用 式 (4. 68), 引 入 函数 
el(nym ai 代替 了 原来 的 常数 Rr KB eng, yee yma ye ,mz) 是 一 个 
依赖 于 ”和 m 的 函数 ,该 函数 可 以 使 判别 距离 随 着 嵌入 空间 的 维 数 和 使 用 的 参考 
向 量 不 同 而 变化 ,从 而 提高 了 适应 异常 数据 波动 的 能 力 。 另 外 ,虚假 邻 点 算法 的 收 
全 判别 是 通过 使 用 固定 参数 a 确定 的 ,显然 在 不 同 的 应 用 场合 提前 给 定 一 个 收敛 
阀 值 是 不 合适 的 ,如 果实 际 数据 中 含有 高 级 别 的 噪声 信号 , 则 收敛 阔 值 需要 放大 到 
25% ,而 当 信 号 比较 干净 的 时 候 , 这 个 阔 值 又 需要 减少 到 5% ;为 了 解决 这 个 问题 ， 
改进 算法 通过 式 (4. 72), 给 出 了 一 个 多 变量 环境 下 搜索 嵌入 维 数 时 的 收敛 变化 曲 
线 ,通过 观测 Em) 随 幅 入 维 数 增加 的 变化 曲线 ,我 们 可 以 找 出 Es (m) 不 再 增加 或 
者 变化 的 嵌入 维 数 mo, 则 mo 十 1 就 是 所 求 的 最 住 嵌 入 维 数 。 该 算法 经 过 测试 对 离 
散 型 或 者 连续 型 非 线 性 动力 系统 产生 的 非 线 性 时 间 序 列 均 可 以 有 效 地 寻找 出 最 佳 
重 构 嵌 入 维 数 参数 .在 有 噪声 干扰 的 情况 下 ,仍然 可 以 给 出 比较 接近 真实 情况 的 估 
计 值 作为 计算 的 一 个 最 终结 果 , 式 (4. 73) 还 可 以 给 出 各 个 参与 重 构 变 量 所 需要 使 
用 的 局 部 相 空间 重 构 维 数 。 

由 此 可 以 看 出 ,在 多 变量 环境 下 该 改进 算法 避免 使 用 这 两 个 关键 参数 Rr 和 
6, 使 得 计算 工作 更 加 简单 ,改进 算法 在 搜索 全 局 最 佳 幅 入 维 数 的 同时 还 可 以 给 出 
最 佳 的 局 部 嵌入 空间 维 数 组 合 ,简化 了 多 变量 环境 下 相 空间 的 重 构 工 作 。 


4.3.4 嵌入 维 数 算法 的 仿真 计算 
例 4.4 考虑 以 下 Lorenz 系统 
旦 = 一 z) 
rr-a- (4.74) 
a 
其 中 o=10,r=28,6=%, 取 初 值 xo = 15. 34, yo= 13. 68, zo — 37. 91, 利 用 四 阶 


Runge-Kute 法 积分 分 别 计算 z,y,z, 积 分 步 长 为 ==0.04, 计 算 过 程 中 精度 为 
0. 0001 ,得 长 度 N= 2000 的 三 个 变量 的 时 间 序 列 (zujs-, (Yahama o {zx}?-1, 对 前 两 
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个 变量 构成 的 双 变量 时 间 序 列 {z,) 并 1 和 {y,) 并 1, 利 用 互信 息 最 小 可 得 它们 的 最 佳 
延迟 时 间 间 隔 为 mn 一 rz 一 4, 按 式 (4. 58) 做 以 下 双 变量 时 间 延 迟 重 构 


Xn = (Lup Lemay Zac Yat Yam nam) 


n = No, No + 101,7 Ni No = 4[maxon m) —1] +1 (4. 75) 


若 记 当 m 变 成 my +1 时 按 式 (4. 66) 计 算 的 虚假 最 近邻 点 数 为 K1, 当 ms 变 成 m 
十 1 时 按 式 (4. 66) 计 算 的 虚假 最 近邻 点 数 为 玉 :, 则 虚假 最 近邻 点 数 随 阔 值 及 嵌入 
维 数 的 变化 情况 可 见 表 4. 1 。 

从 表 4. 1 RITU m= m=? R mi —2,m,—1 时 ,虚假 最 近邻 点 数 为 K M K: 
都 很 小 ,几乎 接近 于 零 ,在 总 点 数 中 的 比例 已 很 小 ,因此 可 以 认为 它们 是 最 小 戏 入 


维 数 。 
表 4.1 虚假 最 近邻 点 数 随 阅 值 及 嵌入 维 数 的 变化 情况 
阅 值 WHERE WR 虚假 最 近邻 点 数 虚假 最 近邻 点 数 
Rr m m Ki Ki 
1 1 | 17 | 12 
20 1 2 [ 0 [ 1 
2 1 | 3 | 0 
1 1 | 13 J 10 
25 1 2 0 | 1 
2 1 | 3 | 0 
1 1 | 13 | 7 
30 1 2 [ 0 | 0 
2 1 2 0 
例 4.5 考虑 如 下 两 个 不 完全 相同 的 Rossler 方程 的 耦合 系统 
x =— ay 一 zl 十 ez — z) 
in = wx, + 0.159; 
dz, 
dt = 0.2 + zG; — 10) 
d (4. 76) 
C m en com eG — 2) 
dy, 
dr were + 0. 15y2 
dz; 


Ge 0:2 + æ2 — 10) 


其 中 四 一 0. 99, ws 一 0.95。 文献 [113，116] 的 计算 过 程 ,系统 初始 状态 为 mo 一 
0.1,y1.0 二 0.2,z1,0 二 0.3,72.0 二 y2.0 二 0,z2.o0 二 15, 这 里 取 e=0. 05 和 0.50,888 S 
数 e 对 应 耘 合 系统 的 间歇 延迟 同步 和 完全 同步 两 种 状态 。 


第 四 章 ”多 变量 时 间 序列 相 空 间 重 构 * 897 


采用 四 阶 Runge-Kuta 积分 法 分 别 计算 变量 zi oy: 2122922 HY 15 000 个 
观测 值 , 并 取 后 2000 个 数据 作为 试验 对 象 。 分 别 对 变量 r 作 单 变量 时 间 序 列 重 
构 , 对 变量 zi,zz 作 两 变量 时 间 序 列 重 构 , 对 变量 mins y 作 三 变量 时 间 序 列 重 
构 , 对 变量 nno ys 作 四 变量 时 间 序 列 重 构 。 延 迟 时 间 间 隔 采 用 互信 息 法 计 
算 , 对 变量 r 作 单 变量 时 间 序 列 重 构 时 ,嵌入 维 数 采用 2. 2. 1 节 中 改进 的 虚假 邻 
点 法 计算 ;对 变量 r aes 作 两 变量 时 间 序 列 重 构 时 ,对 变量 nsns yi 作 三 变量 时 间 
序列 重 构 时 ,对 变量 zi ,x,y1,yz 作 四 变量 时 间 序 列 重 构 时 ,嵌入 维 数 采用 4. 3. 3 
节 中 改进 的 虚假 邻 点 法 计算 ,计算 结果 见 表 4. 2。 


表 4. 2 不 同 蜀 合 强度 下 各 种 重 构 方式 的 重 构 参数 


重 构 参数 、 mes 
mie 0.05 0.50 
重 构 变量 
LEES CI 6/17 | 7/4 
两 变量 ri ,zs 重 构 4/17,3/14 | 6/14,1/14 
三 变量 sry 重 构 1/17,4/14,2/11 | 6/14,1/14,1/14 


四 变量 xi,zz,yi,yz MH 1/17,4/14,2/11,1/16 1/14,4/14,1/14,1/14 


例 4.6 考虑 如 下 Rossler 方程 和 Hyper Rossler FEHMA KE 


da 


dd = wy, — z + ea, — x) 

A = wz, + 0.159 

d = 0.2 + Gi — 10) 

r3 = wy + 0.252; + zz + eG, — 22) SENG 
P = 3 + yw: 

E =— 0. 5y2 + 0. 052; 

E — — 


其 中 w=0.925。 系 统 初始 状态 为 ro 一 0. 1,y.o 一 0.2,zio 一 0. 352297 32970, 
zz 一 15,zozo 一 一 20, 这 里 取 e=0. 008 和 0. 012, 耦 合 参数 e 对 应 耦合 系统 的 非 同 
步 和 同步 演化 。 

采用 四 阶 Runge-Kuta 积分 法 分 别 计算 变量 zi,yi,zi,zz,yavzzvros 的 15 000 
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个 观测 值 , 并 取 后 2000 个 数据 作为 试验 对 象 。 分 别 对 变量 x, 作 单 变量 时 间 序 列 重 
构 , 对 变量 nio 作 两 变量 时 间 序列 重 构 , 对 变量 nons ws 作 三 变量 时 间 序 列 重 
构 , 对 变量 rro wes yi 作 四 变量 时 间 序 列 重 构 。 延 迟 时 间 间 隔 采用 互信 息 法 计 
算 ,对 变量 c 作 单 变量 时 间 序 列 重 构 时 ,嵌入 维 数 采用 2. 2. 1 节 中 改进 的 虚假 邻 
点 法 计算 ;对 变量 zi,zz 作 两 变量 时 间 序 列 重 构 时 ,对 变量 ns ,zz,w 作 三 变量 时 
间 序 列 重 构 时 ,对 变量 ay, 22, wes ya 作 四 变量 时 间 序 列 重 构 时 ,嵌入 维 数 采用 
4. 3. 3 节 中 改进 的 虚假 邻 点 法 计算 ,计算 结果 见 表 4. 3。 


表 4.3 不 同 粳 合 强度 下 各 种 重 构 方式 的 重 构 参数 


重 构 参数 mas 
— m/e 0. 008 0.012 
KHER 
MEN x1 重 构 1/15 8/15 
两 变量 =i,zz 重 构 5/15,3/12 2/15,6/14 
三 变量 riru 重 构 2/15,1/12,3/15 3/15,2/14,1/18 
四 变量 rzw y 重 构 3/15,5/12,1/15,1/15 3/15,2/14,5/18,1/13 


上 述 多 变量 相 空间 重 构 参 数 的 选择 是 否 合适 ,将 在 4. 4 节 中 通过 计算 几何 不 
变量 来 说 明 。 


4.4 多 变量 时 间 序 列 重 构 相 空间 中 几何 不 变量 的 计算 


在 多 变量 时 间 序 列 重 构 的 相 空间 中 ,几何 不 变量 的 计算 与 单 变量 时 间 序 列 重 
构 的 相 空间 中 类 似 , 这 里 我 们 将 把 P. Grassberger 和 I. Procaccia 给 出 的 G-P 关联 
维 数 推广 到 广义 关联 维 数 , 并 讨论 在 时 间 序列 长 度 较 短 的 情况 下 ,最 大 Lyapunov 
指数 的 计算 方法 。 由 于 多 变量 时 间 序列 包含 更 多 的 信息 ,因此 可 以 预期 在 计算 几何 
不 变量 时 对 时 间 序 列 的 长 度 要 求 会 比 单 变量 时 间 序列 的 情形 有 所 降低 。 


4.4.1 广义 关联 维 数 的 计算 


x 

ERRU 58) 重 构 的 m 维 空间 中 ， 2) HG— lxx, DRRR x 本 身 外 
Bi) x, 的 距离 小 于 的 交 的 点 数 , 其 中 HC + )Æ Heavside 函数 ,定义 按 上 述 方式 重 
构 的 有 工 个 变量 的 时 间 序列 {z.,)*1( 二 1,2,…, 工 ) 的 g 阶 广义 关联 积分 为 


CE) = CE sty marum semi) 
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" 1 N 1 N ny 
-| 二 二 Ux; x, È He = laal | (4.78) 


I 

其 中 9 EERS q41 NE q—2 时 就 是 通常 的 关联 积分 。 当 9 一 1 时 , 即 一 阶 广 
义 关联 积分 定义 为 

lnCf(r) 一 limInC; (r) 


1 1 c 1 = ub 
= lim zi PE-AGGAU A, He- Ex xl] 


NU 


N N 
— SD 1 pae 
TN-NQE 1A" NW = Ni HG — lxr—xl) (4. 79) 


TN, Nei 


其 中 ChE T ERUIT r 73 ARSE ATR. ER FEMS LA EL 
限 长 这 种 理想 状况 下 , 当 g==2,N 一 oo 时 ,CY(r) 一 CC) = ph Il xx, | <r} om 
维 空间 中 两 个 随机 选取 的 点 x; 与 x 在 同一 半径 为 的 球 内 的 概率 ,此 时 关联 维 数 
的 严格 定义 为 Ch, 加 


d, = lim lim IPC (4. 80) 


moo ro l 
同 理 可 以 定义 广义 关联 维 数 为 


" 
d, = 7} lim lim lim Ince) 4.81) 


meo r0 N 一 co nr 
它们 是 刻画 系统 复杂 程度 的 一 个 几何 不 变量 但 在 实际 应 用 中 ,由 于 数据 有 噪声 及 
测量 误差 , 且 不 可 能 无 限 长 ,因此 只 能 找 关联 维 数 的 近似 值 来 刻画 系统 的 复杂 性 。 
在 实测 有 限 长 时 间 序 列 中 , 若 r>、max_ lE x x; M ,一 切 点 对 的 距离 都 不 会 超过 


它 ,因而 C=; r< min, 1 xi—2x; |] ClO) =0. But r 既 不 能 选 得 太 


大 "也 不 能 选 得 太 小 , 太 大 或 太 小 的 ~ 都 不 能 反映 系统 内 部 的 性 质 , 同 样 由 于 受到 
数据 长 度 的 限制 m 也 不 能 取得 太 大 。 如 果 在 ~ 的 某 一 区 间 段 内 ,有 
CLG) cc r7 (4. 82) 
则 称 d, 是 9 阶 广义 关联 维 数 ,g= 2 时 就 是 通常 的 G-P 关联 维 数 4。 可 以 认为 这 样 
定义 的 ds 就 是 近似 刻画 多 变量 时 间 序 列 描述 的 复杂 系统 复杂 程度 的 某 种 维 数 。 
下 面 的 问题 是 式 (4. 82) 什 么 时 候 成 立 ? 一 种 思想 是 让 嵌入 维 数 m 变化 , 当 m 
<d 时 ,由 于 重 构 相 空间 的 维 数 不 够 高 ,以 致 不 能 分 辨 吸引 子 的 结构 ,因此 ,此 时 
双 对 数 InC'(-)-Inr 图 的 斜率 近似 取 嵌 入 维 数 ; 当 m 增加 时 , 重 构 相 空间 中 吸引 子 
的 分 辩 能 力 改善 ,m 增加 到 斜率 达到 一 个 平稳 时 期 为 止 ,此 时 双 对 数 InC? Cr)-Inr 
图 中 可 找到 平行 直线 区 域 ,这 些 直线 的 斜率 与 m 的 依赖 性 消失 ,该 斜率 即 为 所 求 
的 广义 关联 维 数 wm。 对 单 变量 无 噪声 无 限 长 时 间 序 列 ,文献 L[11] 证 明了 只 要 m= 
ceil (d2) (HEF ceil(d:) 是 大 于 等 于 d; 的 最 小 整数 ] 就 出 现 平稳 时 期 ,但 对 有 限 长 具 
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噪声 的 时 间 序 列 ,平稳 时 期 开始 的 m 要 大 于 ceil(d,)。 另 一 种 思想 就 是 假定 按 前 面 
的 方法 重 构 了 相 空 间 , 并 确定 了 嵌入 维 数 ,此 时 式 (4. 82) 应 在 7 的 某 区 间 内 成 立 ， 
则 可 求 出 d,。 

在 实际 应 用 中 ,确定 了 平稳 时 期 后 ,直线 的 斜率 可 由 不 同方 法 计算 。 例 如 , 当 
rir? 在 满足 式 (4. 82) 的 -的 某 区 间 段 内 , 则 
ger RN - (4.83) 


或 在 满足 式 (4. 826 r —— KT myra,…rk, 由 最 小 二 乘法 ,得 


K Y]lnrilnCtGu) 一 Sylar Sinctern 
d, = — EX (4. 84) 
KY (dnr)? — ( X) 
实测 时 间 序 列 在 找 双 对 数 InC!(r)-lnr 图 的 线性 部 分 时 ,由 于 连续 采样 点 之 间 
的 相关 性 ,会 造成 “ 肩 峰 ? 效 应 ,为 了 消除 这 种 “ 肩 峰 ? 效 应 ,参考 单 变量 时 间 序 列 关 
联 积分 的 处 理 方式 ,把 广义 关联 积分 式 (4.77) 和 式 (4. 78) 修 改 为 
Chr a) = 


ELE 
N-N,—4 


d= 


[nnal S+ 5 Ho- tax pT] "FS 


(RE JEN, jate 


9 天 1 (4. 85) 


x ine N 
—— 1 TR 
InChr 2) = x — y 5, 24, ln ZX 六 + M)HG-Ix-—xd 


lo TN, jte 


(4. 86) 
说 明 ， 
D 在 数据 无 噪声 、 无 限 精确 及 无 限 长 的 理想 状况 下 ,9 阶 广义 关联 维 数 与 R” 
中 所 采用 的 范 数 无 关 , 这 是 由 于 
lx — xls < bx — xli m lx — xls (4. 87) 
因此 
He 一 ‖zx —xl 22 HG — lx —xjl22HG6t-—-m lx — x, 2) 
=H F- Isle) (4. 88) 
pul 
a 


Chi 0 Sha, sud 


从 而 由 式 (4. 81) 及 极限 计算 的 夹 通 定理 知 
dost = doi, (4. 90) 
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2) 不 同 研究 对 象 的 观测 时 间 序 列 数据 的 量 级 差别 往往 很 大 ,在 确定 计算 广义 
关联 维 数 的 尺度 区 域 时 ,r 的 选择 差异 较 大 ,因此 造成 的 累积 误差 可 能 也 很 大 ,为 
此 可 对 数据 作 标 准 化 处 理 。 设 观测 获得 的 多 变量 时 间 序 列 为 {zn)?1 (1.2, 
L), ZX 


zi, = 一 Ze = 1,2, N; L= 12 (4.91) 
Tmax 一 Tmin 


其 中 coin = min {ip 21,2, L; 71,2, N} rss maxi |1=1,25 s L; 
n7—1,2,-, N} W occur, 1 LICE L RD LR AE EM RBA 


lx — a; | = — lx; — xl (4. 92) 
因此 
Cpr) = Ch Cmax 一 xr] (4. 93) 
则 
Cj ^r) ec Chir) ec rn (4, 94) 


即 (r0 1,2, L G4 01,2, LA AEG T LEK E HH AT 
{xinh (1,2, LR BE RE KIRA BY r 总 满足 


nanala nol O — Limb 
a e — gt 
o< — <r< —— (4. 95) 
若 取 ZL" 范 数 , 则 7 总 满足 
ox <r<l (4. 96) 


在 双 对 数 InCz GO-Inr 图 上 ,lnr 可 在 [一 4,0] 之 间 选 取 ,4 J& 3E — ER. 

下 面 通过 一 个 具体 的 例子 来 说 明 多 变量 时 间 序 列 相 空间 重 构 中 计算 广义 关联 
维 数 的 精确 程度 。 对 例 4. 4 的 Lorenz 系统 的 前 两 个 变量 构成 的 双 变 量 时 间 序 列 
{zn} 和 (ys) 各 1, 按 例 4.4 中 的 计算 , 取 omy = 1, ms 二 2 HERR A ER, = 
一 4 作为 最 佳 延迟 时 间 间 隔 , 按 式 (4. 58) 做 以 下 双 变量 时 间 延 迟 重 构 

Xa = (Ens Yas Yn-4) s N = 5,65 N (4. 97) 
取 时 间 序列 长 度 N —16 384,7 Æ min. || xi—x, || =exp(—5. 546 778 73) f 
EN | x,—x; || =exp(3. 952 235 53) 之 间 取 值 , 取 201 个 均匀 的 点 得 到 了 图 4. 8 
所 示 的 InCEGO-Inr 图 。 

从 图 4.8 中 可 看 出 , 当 - 较 小 时 ,Ci(r) 产 生 了 “ 肩 峰 ”效应 ,但 当 r 在 
exp( 一 1. 034 746 95) 和 exp(0.770 065 76) 之 间 取 值 时 ,达到 了 平稳 时 期 , 即 可 找 
到 双 对 数 nC! (r)-Inr 图 的 尺度 区 域 (scaling region) ,在 此 区 域内 ,图 形 几乎 成 直 
线 , 因 此 ,由 式 (4.84), 取 天 一 39 个 均匀 的 点 ,经 计算 得 di = 2. 009 86, d: = 
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jnCy(r) 


图 4.8 Lorenz 系统 的 InCLG)-Inr 图 
实 线 表示 q 1; 点 画 线 表示 q= 2s MRRA 9 二 3 
2.070 68, d: 一 2. 003 25, 这 与 文献 [26] 中 的 ds 一 2. 04 以 及 文献 [117] 中 的 o 
2. 01 非常 接近 ,但 这 里 所 用 的 时 间 序 列 长 度 要 短 得 多 。 


4.4.2 小 数据 量 情况 下 最 大 Lyapunov 指数 的 计算 


最 大 Lyapunov 指数 定量 地 描述 系统 相 空 间 相 邻 轨道 旦 指数 发 散 或 收敛 的 
性 质 ,是 描述 混沌 动力 学 特性 的 重要 参数 之 一 ,为 二 0 是 系统 具有 混沌 特性 的 重要 
指标 。 当 系统 的 模型 已 知 时 ,可 以 利用 相 空 间 的 切 向 量 精确 计算 最 大 Lyapunov 指 
数 。 当 复杂 系统 只 能 获得 观测 时 间 序 列 时 ,为 了 计算 最 大 Lyapunov 指数 ,A，Wolf 
提出 了 轨道 跟踪 法 ,随后 M. T. Rosenstein 等 进行 了 改进 ,但 仍 存在 精度 不 高 、 受 
噪声 影响 大 ,计算 量 大 等 问题 中。 为 此 ,文献 [119] 在 深入 研究 相 空间 重 构 技 术 和 
轨道 跟踪 技术 的 基础 上 提出 了 一 种 比较 稳健 的 计算 方法 。 这 些 方 法 都 是 对 观测 的 
单 变量 时 间 序 列 进行 处 理 的 ,但 在 实际 问题 中 ,被 观测 的 复杂 系统 往往 有 多 个 变量 
描述 ,通过 观测 或 实验 手段 可 以 获得 多 变量 时 间 序列 ,理论 上 多 变量 时 间 序 列 比 单 
变量 时 间 序 列 包含 更 多 的 关于 原 复杂 系统 的 信息 ,采用 多 变量 时 间 序 列 计算 得 到 
的 最 大 Lyapunov 指数 应 更 加 真实 。 同时 ,实际 问题 中 通过 观测 或 实验 获得 的 时 间 
序列 可 能 不 是 很 长 , 较 短 的 多 变量 时 间 序 列 是 否 也 能 获得 较 精 确 的 最 大 Lyapunov 
指数 ,这 是 一 个 很 有 意义 的 问题 。 

下 面 将 把 文献 [118，119] 中 对 小 数据 量 单 变 量 时 间 序列 的 最 大 Lyapunov Tí 
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数 算法 推广 到 多 变量 时 间 序 列 的 情况 下 。 由 于 小 数据 量 方法 与 A， Wolf 方法 一 样 
是 基于 重 构 相 空间 进行 计算 的 ,因此 首先 使 用 多 变量 时 间 序 列 相 空间 重 构 参 数 的 
选择 算法 寻找 重 构 参 数 并 利用 计算 结果 进行 重 构 , 进 一 步 利 用 重 构 相 空间 采用 小 
数据 量 方法 计算 Lyapunov 指数 ,并 通过 6 维和 7 ERA Rossler 混沌 系统 产生 的 
多 变量 数据 仿真 计算 检验 了 算法 的 有 效 性 。 

设 (zj 一 1,2,…, 汪 ) 为 观测 的 艺 变 量 的 时 间 序列 ,做 式 (4. 58) 的 相 空 间 
重 构 。 对 每 个 点 x, 寻找 其 最 近邻 点 xxn ,这 两 个 点 之 间 必 须 有 短暂 的 分 离 , 以 保证 
两 个 点 沿 着 不 同 的 轨道 运行 。 定 义 分 离间 隔 


_ maxr, 


v= = 1,2,L (4. 98) 
假定 d,CO 28 x, 到 其 最 近邻 点 zw 的 距离 , 即 
4,() = | x, — xu5 ll» lj — 70| > w (4. 99) 
对 相 空 间 中 的 每 个 点 ,计算 出 其 最 近邻 点 在 i 步 前 向 演化 后 的 距离 
djG) = || xjr — Anti ll» i= NoNo + lye N (4. 100) 
假定 x, 的 最 近邻 点 以 最 大 Lyapunov 指数 的 速率 发 散 , 即 
di) = d;(0) x e^» (4.101) 
两 边 取 对 数 ,得 
lndiG) = Indj(0) + AG X At) (4. 102) 
HE Ind,(i)-i X At 图 中 ,利用 最 小 二 乘法 拟 合 得 到 最 大 Lyapunov 指数 为 
A= sali x ya] (4. 103) 


n 
式 中 ， y= 站 2nd, C sp HEF GONNE. 

为 了 说 明 在 时 间 序 列 长 度 较 短 的 情况 下 ,上 述 计算 最 大 Lyapunov 指数 方法 
的 有 效 性 ,同时 也 为 了 说 明 多 变量 时 间 序 列 相 空间 重 构 的 必要 性 ,下 面 通 过 两 个 耦 
合 混沌 系统 进行 仿真 分 析 。 

对 例 4.5 中 的 两 个 不 完全 相同 的 Rossler 方程 的 耦合 系统 ,在 e= 0.05 和 
0. 50 时 ,最 大 Lyapunov 指数 的 理论 值 分 别 为 0. 076 804 和 0. 095 137。 按 例 
4. 5 的 计算 所 得 的 重 构 参 数 进行 相 空 间 重 构 ,并 按 上 述 方法 计算 其 最 大 Lyapunov 
指数 ,结果 见 表 4. 4 和 表 4. 5。 

表 4.4 和 表 4. 5 中 的 第 二 列表 示例 4.5 中 计算 的 相 空间 重 构 参 数 ,第 三 列表 
示 按 上 面 的 方式 计算 的 最 大 Lyapunov 指数 入 ,第 四 列表 示 计 算 结果 与 理论 值 的 
偏差 ,用 百分比 表示 。 
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表 4.4 BERRA. 76) 在 es= 0. 05 时 的 最 大 Lyapunov 指数 


RR musa. | ”为 的 计算 什 mm 
单 变量 x 重 构 6/17 0.061 173 一 20.35% 
两 变量 ri,z* 重 构 4/17,3/14 0. 066 882 12.92% 
CU nri 重 构 1/17,4/14,2/11 0.070 499 一 8.21% 
WERE zzvi: 重 构 1/17 44/14 52/11, 1/16 0.071 536 — 6. 86% 


表 4.5 MERKA. 76)e=0. 50 时 的 最 大 Lyapunov 指数 
-一 一 一 一 一 一 一 一 一 一 


重 构 变 二 重 构 参数 m/r 为 的 计算 值 偏差 
Mht zx! 重 构 7/14 0.073 55 —22. 69% 
g 两 变 址 rivz? 重 构 6/14,1/14 | 0. 083 21 —12. 54% 
EEH nry 重 构 6/14,1/14,1/14 0. 0858 —9.816 


重 构 1/14,4/14,1/14,1/14 0. 090 84 4.51% 


同样 对 例 4. 6 中 Rossler 方程 和 Hyper Rossler 方程 的 耦合 系统 ,在 e=0. 008 
和 0. 012 时 ,最 大 Lyapunov 指数 的 理论 值 分 别 为 0. 104 558 和 0.128 993。 按 
例 4. 6 的 计算 所 得 的 重 构 参数 进行 相 空 间 重 构 , 并 按 上 述 方法 计算 其 最 大 Lya- 
punov 指数 ,结果 见 表 4. 6 和 表 4. 7。 


34.6 MARHA. 77) 在 s 一 0. 008 时 的 最 大 Lyapunov 指数 


重 构 变量 重 构 参数 m/r 入 的 计算 值 偏差 
SUE Ht ri 重 构 7/15 0. 042 245 —59. 60% 
PAE HE ai ee 重 构 5/15,3/12 0. 046 174 一 55.84% 
TAB riro 重 构 2/15.1/12.3/15 0. 084 368 | —19.31% 


WER rzw y 重 构 3/15,5/12,1/15.3/1 0. 103 549 一 0.97% 


表 4.7 耦合 系统 (4. 77)166— 0.012 时 的 最 大 Lyapunov 指数 


— 


重 构 变量 重 构 参数 m/r A 的 计算 值 偏差 
HE zs 重 构 | 8/15 | 0. 083 325 —85. 40% 
两 变量 x1 22 重 构 2/15,6/14 0.098 919 —23. 31% 
三 变量 srw 重 构 3/15,2/14,1/18 0. 106 871 一 17.15% 
四 变量 x1,z2,w2,yi 重 构 3/15,2/14,5/18,1/13 0.121 149 — 6.08% 


表 4.4~~ 表 4.7 的 计算 结果 表明 ,采用 多 变量 时 间 序 列 计算 最 大 Lyapunov 指 
数 明显 优 于 采用 单 变 量 时 间 序 列 时 的 计算 结果 .相对 于 理论 计算 值 的 偏差 ,在 采用 
A 个 变量 时 偏差 可 以 下 降 到 一 7%% 以 内 。 该 仿真 计算 表明 对 较 短 的 时 间 序列 在 多 变 
量 情况 下 计算 最 大 Lyapunov 指数 是 可 行 的 。 


第 四 章 ”多 变量 时 间 序列 相 空 间 重 构 *97* 


为 了 进一步 验证 和 说 明 时 间 序 列 长 度 对 计算 最 大 Lyapunov 指数 的 影响 ,对 
例 4.5 和 例 4.6 中 的 两 个 系统 , 按 前 面 的 相 空 间 重 构 参数 ,在 单 变量 重 构 时 , 取 
2000 个 数据 ,在 多 变量 重 构 时 ,时 间 序 列 的 长 度 取 2000/1, Ach 是 变量 的 个 数 ， 
即 随 着 变量 数量 的 增加 而 减少 时 间 序 列 的 长 度 , 计 算 结 果 分 别 见 表 4. 8 一 表 4. 11。 


34.8. 耦合 系统 (4. 76) 在 e 一 0. 05 时 的 最 大 Lyapunov 指数 的 比较 


sure: | fonts | mensam, | o temen 
1 0. 061 173 0. 061 173 0. 076 804 
2 0. 066 882 0. 080 560 0. 076 804 
3 0. 070 499. 0. 084 590 0. 076 804 
4 0.071 536 0. 082 160 0. 076 804 


4.9 MARC. 76) 在 s 一 0. 50 时 的 最 大 Lyapunov 指数 的 比较 
COO 


warm mee | mme 
i | 0.073 547 0.073 547 0. 095 137 
2 0.083 211 0. 082 670 0. 095 137 
3 I 0. 085 802 1 0.085 450 0. 095 137 
4 i 0.090 843 0. 083 840 0. 095 137 


表 4. 10 MARK. 77) 在 e 一 0. 008 时 的 最 大 Lyapunov 指数 的 比较 
时 间 序 列 长 度 为 时 间 序 列 长 度 为 


FENE! 2000 时 计算 的 Ar 2000/1 计算 的 A — 
1 0.042 245 0.042 245 0. 104 558 
2 0.046 174 0. 080 260 0. 104 558 
3 0. 084 368 0. 108 440 0. 104 558 
4 0. 103 549 0. 099 330 0. 104 558 


表 4.11 MEREU. 77) 在 se 一 0. 012 时 的 最 大 Lyapunov 指数 的 比较 


— | — | meme o 
1 0.083 325 0.083 325 0.128 993 
2 0.098 919 0. 088 860 0. 128 993 
3 0. 106 871 0. 109 560 0.128 993 


4 0.121 149 i 0. 124 510 0. 128 993 
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表 4.8—3 4.11 的 计算 结果 表明 :采用 多 变量 时 间 序列 计算 时 , 随 着 变量 数 
量 的 增加 ,对 于 时 间 序 列 的 长 度 可 以 明显 减少 ,而 计算 结果 相差 不 多 。 例如 ,采用 4 
个 变量 长 为 500 的 时 间 序 列 和 采用 4 个 变量 长 为 2000 的 时 间 序列 计算 的 结果 十 
分 接近 ,而 且 始 终 优 于 单 变量 .2 个 变量 和 3 个 变量 长 为 2000 的 时 间 序 列 的 计算 
结果 。 因 此 ,在 观测 时 间 序 列 长 度 有 限 的 情况 下 ,通过 多 变量 时 间 序列 重 构 从 某 种 
程度 上 可 以 弥补 时 间 序 列 长 度 的 不 足 。 


4.5 多 变量 时 间 序 列 相 空间 重 构 中 噪声 的 影响 


观测 或 实验 获得 的 时 间 序列 常常 含有 噪声 ,下 面 通过 例 4. 5 中 的 耦合 系统 进 
行 仿真 分 析 ,来 比较 噪声 对 单 变量 时 间 相 空间 重 构 和 多 变量 时 间 序 列 相 空间 重 构 
的 影响 程度 。 

定义 含有 测量 噪声 (假设 为 高 斯 噪声 ) 的 信号 为 y,y 一 x 十 $,z 是 观测 系统 的 
真实 数据 , 代表 噪声 , 且 2 —od/oi o^ 是 相应 数据 的 方差 ,z 代表 噪声 级 别 , 下 面 的 
仿真 试验 中 分 别 讨论 = 一 2% 和 z 一 20% 两 种 情况 。 

对 例 4. 5 中 的 耦合 系统 通过 四 阶 Runge-Kuta 积分 法 得 到 的 时 间 序 列 , 图 4.9 
和 图 4. 10 分 别 是 当 e 一 0. 05 和 e—0. 50 时 对 时 间 序 列 {z,} 加 了 2% 噪声 后 利用 改 
进 的 最 近邻 点 法 计算 嵌入 维 数 的 过 程 ,图 4. 9 和 图 4. 10 中 曲线 表示 随 着 搜索 全 局 
重 构 相 空间 维 数 的 增加 ,算法 中 E,(m) 逐 步 收敛 的 过 程 .其 中 浅 色 虚 线 和 浅 色 实 线 
分 别 表示 采用 没有 噪声 的 {xz} 和 附加 2% 噪声 后 的 {x} 进行 单 变 量 相 空间 重 构 时 
的 情形 ; 深 色 虚线 为 附加 2% 噪声 后 的 {zy} 和 没有 噪声 的 {x} 进行 两 变量 相 空 间 
重 构 时 的 情形 ; 深 色 实 线 为 附加 2% 噪声 后 的 {x,} .没有 噪声 的 {xz,} 和 {yy 进行 三 变 
量 相 空 间 重 构 的 情形 。 


095 [-- 


E 


09 


0.85 


08 


图 4.9 BB RICE 0. 05 噪声 级 别 = 2H RACHA AB 
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图 4.10 MA ARM e= 0. 50 噪声 级 别 z=2% 时 幅 入 维 数 的 收敛 过 程 

图 4.11 和 图 4. 12 分 别 是 当 e=0. 05 和 =0.50 时 对 时 间 序 列 {z1} 加 了 20% 
噪声 后 ,利用 改进 的 最 近邻 点 法 计算 嵌入 维 数 的 过 程 , 图 4. 11 和 图 4. 12 中 曲线 表 
示 随 着 搜索 全 局 重 构 相 空间 维 数 的 增加 ,算法 中 Es (m) 逐 步 收敛 的 过 程 . 其 中 浅 色 
虚线 和 浅 色 实 线 分 别 表示 采用 没有 噪声 的 {zx1} 和 附加 20% 品 声 后 的 {xz} 进行 单 
变量 相 空间 重 构 时 的 情形 ; 深 色 虚 线 为 附加 20% 噪 声 后 的 {z1} 和 没有 噪声 的 {zx2} 
进行 两 变量 相 空间 重 构 时 的 情形 ; 深 色 实 线 为 附加 20% 品 声 后 的 {zx} 、 没 有 噪声 
的 {zs} 和 {y} 进 行 三 变量 相 空 间 重 构 的 情形 。 


4.11 耦合 系数 c= 0. 05 噪声 级 别 = 一 20% 时 嵌入 维 数 的 收敛 过 程 


根据 改进 的 最 近邻 点 算法 求 得 的 戏 入 维 数 的 结果 见 表 4. 12。 其 中 第 3 列表 示 
没有 噪声 的 单 变量 时 间 序 列 {zi} 的 重 构 参 数 , 第 4 列表 示 附 加 噪声 的 单 变量 时 间 
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图 4.12 耦合 系数 e 一 0. 50 噪声 级 别 = 一 20% 时 供 入 维 数 的 收敛 过 程 


序列 {zi} 的 重 构 参数 ,第 5 列表 示 附 加 噪声 的 时 间 序 列 {zi 八 没有 噪声 的 时 间 序列 
{zz} 进 行 2 变量 重 构 时 的 重 构 参 数 ;第 6 列表 示 附 加 噪声 的 时 间 序 列 {zi)\ 没 有 噪 
声 的 时 间 序 列 {z*} 和 {2 进 行 3 变量 重 构 时 的 重 构 参数 。 


表 4. 12 不 同 噪 声 级 别 下 相 空 间 重 构 参数 的 计算 结果 


nma 
级 别 强度 


0. 05 


Tn 
TEM 


8/11 | 5/11.2/14 


TEM r + XEM xe 
十 无 只 yı 
5/11,2/14,1/14 
oso | zm | sa | sasin | s/t 


XN d xy 


6/17 


0.05 | 6/17 | 13/10 | 6/10,2/14 | 6/10,2/14.1/11 


0.50 7/14 12/11 7/10,1/14 8/10,1/14.1/14 


从 图 4. 9 一 图 4. 12 PTAA H , EE BEA WR FE SE CT CA, SE DSL 19 
索 时 ,算法 可 以 有 效 地 收敛 ,在 e 0. 05 时 ,算法 可 以 给 出 正确 的 重 构 相 空间 维 数 
6, 在 e=0.50 时 ,由 于 混沌 斐 度 加 强 , 耦 合 系统 的 特性 发 生变 化 给 出 重 构 维 数 7。 
采用 受 噪声 干扰 的 {z,} 进 行 单 变量 重 构 时 算法 不 能 在 实际 嵌入 空间 维 数 处 收敛 ， 
只 能 勉强 收敛 在 较 大 的 嵌入 维 数 。 对 比 图 4. 9 和 图 4. 11、 图 4. 10 和 图 4. 12 中 的 
浅 色 实 线 和 两 个 深 色 线段 可 以 发 现 ,尽管 使 用 了 附加 噪声 的 数据 ,但 进行 两 变量 时 
间 序列 和 三 变量 时 间 序列 相 空 间 重 构 时 ,算法 可 以 给 出 较 好 的 收敛 性 。 当 噪声 级 别 
较 低 时 ,算法 收敛 时 给 出 的 重 构 维 数 与 实际 重 构 维 数 基本 一 致 ; 当 了 噪声 级 别 较 大 
时 ,算法 虽然 收敛 得 比 低 噪声 级 别 慢 ,但 仍 可 以 给 出 可 用 的 重 构 维 数 。 

对 比 图 4. 9 一 图 4. 12 中 的 深 色 的 实 线 (三 变量 ) 和 虚线 (两 变量 7 可 以 发 现 , 采 
用 三 变量 时 间 序列 重 构 可 以 给 出 比 两 变量 时 间 序 列 重 构 时 更 加 平稳 的 收敛 变化 ， 
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特别 是 图 4. 10 和 图 4. 11 中 可 以 明显 看 出 这 种 差异 ,这 种 现象 可 以 认为 是 由 于 在 
利用 多 变量 重 构 时 , 较 多 的 观测 数据 可 以 引入 更 加 丰富 的 原动力 学 系统 所 包含 的 
信息 ,因此 可 以 反映 出 更 好 的 特性 。 

从 图 4. 9 中 可 以 看 出 ,采用 三 变量 时 间 序 列 重 构 可 以 比 采 用 两 变量 时 间 序 列 
或 单 变量 时 间 序 列 重 构 在 更 小 的 全 局 重 构 维 数 处 达到 收敛 ,这 种 现象 在 其 他 仿真 
结果 中 也 存在 ,这 表明 采用 多 变量 时 间 序 列 重 构 相 空间 的 优越 性 。 当 有 噪声 干扰 
时 ,采用 单 变量 时 间 序 列 重 构 相 空间 时 ,算法 由 于 受到 噪声 干扰 无 法 在 实际 重 构 维 
数 处 达到 收敛 ,直到 较 大 维 数 时 才能 收敛 。 当 噪声 级 别 较 小 (如 2% ) 时 采用 三 变量 
时 间 序 列 重 构 , 本 算法 可 以 给 出 与 无 噪声 干扰 时 的 相近 结果 ; 当 噪 声 级 别 较 大 (如 
20%) 时 采用 三 变量 时 间 序 列 重 构 , 算 法 可 以 在 8 一 9 维 处 收敛 ,与 无 噪声 干扰 时 的 
结果 差距 不 大 。 
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对 某 一 未 知 数学 模型 的 确定 性 系统 通过 观测 或 实验 手段 获得 的 单 变量 或 多 变 
量 时 间 序列 的 研究 中 ,一 个 重要 的 问题 在 于 能 否 以 及 如 果 根据 观测 时 间 序 列 来 推 
知 整 个 动力 系统 的 变化 情况 , 即 非 线 性 时 间 序列 的 预测 问题 .利用 单 变量 或 多 变量 
时 间 序 列 的 相 空间 重 构 理论 ,可 以 对 来 自 于 确定 性 系统 的 非 线性 时 间 序列 包括 混 
沌 时 间 序 列 进行 短期 预测 。 本 章 以 多 变量 时 间 序列 为 研究 对 象 ,介绍 其 预测 方法 ， 
单 变量 时 间 序 列 可 以 作为 多 变量 时 间 序 列 的 特例 。 

设 观测 到 的 工 个 变量 非 线性 时 间 序 列 为 (zjojs-;(t 三 1,2，, 工 ) ,假设 T=N 
十 已 ,前 N 个 数据 作为 构造 模型 所 需 的 样本 ,后 已 个 数据 作为 预测 精度 的 度量 。 采 
用 延迟 重 构 法 ,在 相 空间 中 重 构 的 状态 向 量 为 


x, = (Lins Thm Tm or Lan Tzar" Tan omy — DR EI 
Lim Lime Tia md) € R” 
n= NoN, + lsN (5.1) 


RP, No= max oni Dru) n7 1,2,7 LH miQ—1,2, 7 LS} HAE E 
3R ERE f] [e] BAL AR A ER ALF F. Takens 在 单 变量 情形 下 的 结论 ,一 般 地 ,如 果 


L 
mi & m= 2n. 充分 大 , 则 x, 是 原动力 系统 相应 的 一 条 轨道 到 R 中 的 嵌入 。 由 此 
可 得 到 R” 上 的 一 个 离散 的 动力 系统 Gi R"— R^ ,使 得 


Xas GG (5.2) 
或 者 得 到 多 元 函数 Gi:R" 一 R, 满 足 
Ling = Ci(x)，! 一 12 (5.3) 


非 线 性 时 间 序 列 预测 问题 就 是 根据 {zij-:(! 一 1,2,… LD FADE Gi GSC G9 — 
个 近似 形式 Gr( 或 6)。 当 然 ,由 于 系统 的 混沌 性 质 ,C; 或 G 应 该 是 非 线性 的 . 以 下 
主要 讨论 对 第 一 个 变量 ri. 的 预测 问题 ,其 他 变量 的 预测 类 似 可 得 。 


5.1 多 变量 非 线性 时 间 序列 的 局 域 预测 法 
局 域 预测 法 只 利用 被 预测 点 邻 域内 其 他 点 的 信息 来 拟 合 预 测 函数 ,不 同 的 预 


测 点 处 的 预测 函数 是 不 一 样 的 .常用 的 局 域 预测 法 有 局 部 平均 预测 法 、 局 部 线性 预 
测 法 、 局 部 多 项 式 预测 法 等 。 
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5.1.1. 局 部 平均 预测 法 
设 时 刻 T 的 状态 向 量 为 


Xr = (TLTITLT TT on WELT» Turo vtt TT mg Dt 
SILTITLT- y * VELT- 0,7909) (5.4) 
P xc 的 KK 个 最 近邻 点 x。 xs son exe MRR EEN OUS xr 5 x (k=1, 
2,7 KAMER xri ryt 01,2, KORE, PIE reir tier ts 
Zua+t! 的 平均 作为 zir+: 的 预测 值 , 即 


Á 1 x 
fura K Dy Tren (5.5) 


这 种 预测 方法 称 为 局 部 平均 预测 法 。 

单 变 量 情形 下 的 局 部 平均 预测 法 可 见 文献 [74], 作 为 特例 ,也 可 取 天 =1, 此 
时 称 为 零 级 近似 预测 5 。 

局 部 平均 预测 法 在 找到 预测 点 的 邻 域 后 ,没有 考虑 邻 域 中 的 各 点 到 预测 点 的 
空间 距离 对 预测 的 影响 ,而 相 空 间 中 的 各 点 到 预测 点 的 空间 距离 是 一 个 非常 重要 
的 参数 ,预测 的 准确 性 往往 取决 于 与 预测 点 空间 距离 最 近 的 那 几 个 点 。 因 此 ,可 以 
将 到 中 心 点 的 空间 距离 作为 一 个 拟 合 参数 引入 预测 过 程 ,在 一 定 程度 上 可 以 提高 
预测 精度 ,并 有 一 定 的 降 噪 能 力 。 基 于 此 ,参照 文献 [121] 在 单 变量 时 间 序列 情形 下 
的 改进 ,可 做 如 下 修改 : 


x 
Dna eXPL— od, 一 dein) ] 
Ty — — (5.6) 
Sexpl— od — dain) ] 
HR dam | rx, || m1. 2, K edn m minds o WBA o1. 
上 述 模型 中 ,参数 的 选择 有 主观 性 ,为 此 参照 文献 [122] 在 单 变量 时 间 序列 
情形 下 的 改进 ,同样 可 采用 以 下 改进 的 预测 模型 


des — di. 
4 da. ei dus — dus 
rH = — — (5.7) 
FA dus — duis 


K 
其 中 dm= maxdi. 


5.1.2 局 部 线性 预测 法 
RA T 的 状态 向 量 如 式 (5. 4) 所 示 , 则 对 p 步 之 后 的 值 zir+* 进 行 预测 Bi 
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测 模型 为 
ZT+p= GiOnr) m cock cuni ceni T 二 cm nr m b 


Hem, X2 ur Cm kno Tn Het Cm em T2 T- (ms— Dr 


FCm eem ALT T Cn emp HALL THe T 1 E Om eem TLT- Qj Dee 
(5.8) 
式 中 ,mm 一 ma 十 ma 十 … 十 mcicorciyca' cs 为 待定 系数 ;e AMIR, RARU E 
(e)=0 和 方差 Var(e) 一 一 。 
为 了 估计 这 些 系数 ,计算 目标 点 xz 与 各 个 重 构 向 量 间 的 欧 氏 距离 ,得 到 目标 
点 xr 的 K 个 最 近邻 


xa = (gie exis on Th mon Ta 


Xo Xs ttt s Xay SB 


— — »ZLa 7r TL tm Ur) (5.9) 
则 当 xr 55 x, 1,2, K BERT xri US xe 1,2, 7 K 靠近 。 于 是 问题 
转化 为 求 coyclycz,…，cm, 使 


K K 
Maso — Sree? = D ns — Geer |? 5.10) 
£i a 
最 小 。 若 记 
y = [zia+pyzlha+py…yziearp] € RX (5.11) 
© = [coc rem)” € Rn (5.12) 
l fue Ta O Tre- 
X- l Zie Tie- 7 WLe-0,-08 € Rx i13) 


l Tieg Tiag- "O XLay-O-0t. 
则 利用 最 小 二 乘 原理 ,co,c ,cs，… ,cw 满足 下 面 的 矩阵 方程 
y= Xc (5.14) 
如 果 和 矩阵 XTX 可 逆 , 则 有 
c = (XTX) X'y (5. 15) 
从 而 可 由 公式 (5. 8) 计 算 rreh MWE nione. 
预测 步 数 一 1 时 称 为 一 步 预 测 , 记 >1 时 称 为 多 步 预测 。 
在 上 述 线性 回归 模型 中 一 般 要 求 Km (AB EXE K «im 的 情形 也 同样 适 
用 。 单 变量 时 间 序 列 情形 下 这 一 方法 可 见 文献 [123]。 关 于 参数 K 的 选取 , 单 变量 
时 间 序 列 情形 下 ,文献 [124] 给 出 了 下 面 的 方法 : 
步 又 1: 取 K=2m 十 1,2m 十 2,…，,2m 十 10。 
步骤 2:34 EXE — KH 
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H —XQOUX)X! (5.16) 
D(K) = tr(H) 6.17) 

_ [Y = YX'xxbD?x]Uy — YX' xx xT 
o(K) = K DdO (5.18) 


步骤 3: 选 择 使 HOO BUN Kid K^. 
步骤 4: 利用 天 "构造 局 部 预测 模型 , 即 计算 C, 然 后 进一步 计算 zir+w 的 预测 


值 Tirte 
5.1.3 局 部 多 项 式 预测 法 


单 变量 时 间 序 列 局 部 多 项 式 预 测 法 是 由 J. D. Farmer # J. J. Sidorowich 给 
出 的 0 站 ,选用 的 映射 是 高 阶 多 项 式 ,其 系数 用 最 近邻 点 拟 合 ,文献 [126] 给 出 了 确 
定 多 项 式 阶 数 的 方法 ,用 这 种 方法 能 够 得 到 比 局 部 平均 预测 法 和 局 部 线性 预测 法 
更 好 的 预测 结果 0”],。 既 然 多 变量 的 局 部 平均 预测 法 和 局 部 线性 预测 法 均 比 单 变量 
情形 的 预测 精度 高 ,因此 ,基于 多 变量 相 空间 的 重 构 理论 ,我们 把 单 变量 混沌 时 间 
序列 的 局 部 多 项 式 预测 法 推广 到 多 变量 的 情形 ,给 出 了 多 变量 混沌 时 间 序 列 的 局 
部 多 项 式 法 预测 模型 ”3]。 

设 时 刻 的 状态 向 量 如 式 (5.4) 所 示 , 对 p 步 之 后 的 值 rr+* 进 行 预测 ,于 是 
xr+p 的 第 一 个 分 量 zi.r+s 的 预测 值 .r+p 由 s 阶 多 项 式 得 到 , 即 


yr, =G1(x7) 


m-i mot 
= D a 
Sco + Dehæur⸗a 十 … 十 Cah TL Tm 
im à mh a mh mo 
m- mot 
o "S "m — 
+ Dzor-an 十 … 十 P» Cha TTA Een 
=o E hyo 
mi mot 
* ao qo 
= fang 十 … 十 M — k X LT- A e Lamy 
dico D 


(5.19 
找 xr 的 KK 个 最 近邻 点 x ,x。,，… Xap ， 如 果 系 统 是 确定 的 , 则 当 xr 靠近 xs EE rsp 
WIE xarro 
于 是 问题 转化 为 求 系数 co cD, es cfaor e LIT EM 
Ciia,- op 9 BE 


x . x 
Dy [tite = tarre? = D [arat 7 Gren) |? (5. 20) 
a 


imi 


最 小 。 若 记 
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T 
三 K 
y = [Frap] ER 6.21) 
w w m w m T 
e = [corc r eao e elo omo] E R (5. 22) 
2 wee 4 
l una O Zira- They FL. Xie im, Dn 


2 
l mu O Zren- Tie 0780 Zhe TD 


X= € RY 
l i Pa CU Xie t XLeg-0q-0n, 
(5. 23) 
式 中 待定 系数 个 数 A 
L 
J= 六 Cu+ 一 人 十 1 (5. 24) 


£i 


TU FA) FE i /] — RE DRE FARE cosci enel co tee st sel o ttt s 6 me -n 
满足 下 面 的 矩阵 方程 


y — Xc (5.25) 
为 了 获得 稳定 的 解 ,一 般 要 求 KJ. "RA X" x 可逆, 则 有 
-c= (XTX) XTy (5. 26) 


从 而 可 由 式 (5.19) 计 算 zi,r+s 的 预测 值 zir+o。 

显然 ,局 部 多 项 式 预测 法 推广 了 局 部 线性 预测 法 , 同 局 部 线性 预测 法 一 样 , 预 
测 步 数 p=1 时 称 为 一 步 预测 ,如 >1 时 称 为 多 步 预测 。 

单 变量 时 间 序 列 情形 下 的 局 域 预测 方法 还 有 基于 最 大 Lyapunov 指数 的 预测 
PUO 230、 线性 内 反方 法 Ca 233、 局 域 超 平面 近似 法 3 33 。 

局 域 预测 法 柔性 较 好 , 拟 合 速度 较 快 且 精 度 较 高 ,但 需要 实时 地 拟 合 系数 。 局 
域 预测 方法 的 预测 函数 虽然 在 每 一 步 都 可 能 是 线性 的 或 简单 的 多 项 式 , 但 从 整体 
上 看 却 是 非 线 性 的 。 


5.2 多 变量 非 线性 时 间 序 列 的 全 域 预测 法 


所 谓 全 域 预测 法 是 将 轨 线 中 的 所 有 点 作为 拟 合 对 象 ,寻找 合适 的 函数 G,。 由 
于 实际 问题 中 数据 总 是 有 限 的 ,因而 不 可 能 求 出 真正 的 G1, 只 能 通过 有 限 数据 构 
造 Cu 使 


3XUn2a-GoGoY (5. 27) 


最 小 ,从 而 可 得 全 局 模型 
Line = GIO) (5. 28) 
BA CHERKMMAR ES. 
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全 局 法 在 概念 上 很 清楚 ,但 实现 并 不 容易 ,尤其 当 映射 Gi 很 复杂 时 ,所 以 预测 
时 必须 找 出 G 的 一 个 非 线性 表达 式 。 


5.2.1 多 项 式 通 近 预 测 法 


通常 多 项 式 是 非 线性 表达 式 的 一 个 很 好 近似 ,多 项 式 逼近 预测 法 就 是 从 标准 
函数 基 中 选取 多 项 式 GG, 的 系数 由 最 小 二 乘法 确定 , 当 系数 个 数 和 多 项 式 的 阶 
数 增加 时 ,所 拟 合 的 函数 G, 会 越 来 越 接近 真实 的 动力 系统 。 

取 Gr G0 H Lims mise rt neon Dr ETT ELA Elame? LLa omy I m. 
个 变量 的 * 次 多 项 式 , 即 

Tint. = GIGS) 


= P a risu err m e rte Re nDe 
tyes 


(5. 29) 
其 中 
S = (Guess SE adsis 为 大 于 等 于 零 的 整数 } 
(5. 30) 


当 s 和 m 较 大 时 ,待定 系数 a?.,. 较 多 ,利用 最 小 二 乘法 确定 起 来 非常 复杂 。 
多 项 式 逼近 预测 法 的 缺点 是 当 多 项 式 的 阶 数 很 大 时 ,要 确定 大 量 系数 ,这 往往 
会 超过 计算 机 的 承受 能 力 而 使 计算 无 法 进行 下 去 。 另 外 ,这 时 也 要 求 有 足够 的 样本 点 。 


5.2.2 神经 网 络 预测 法 


用 于 预测 研究 的 神经 网 络 模型 主要 有 多 层 前 馈 型 神经 网 络 ,一 般 的 前 馈 型 神 
经 网 络 具有 台 近 复杂 非 线性 函数 的 能 力 , 通 常 可 以 根据 所 选取 的 样本 数据 对 网 络 
进行 训练 ,在 训练 过 程 中 使 预测 的 均 方差 达到 最 小 ,从 而 建立 相应 的 预测 模型 。 由 
于 一 个 3 层 前 馈 网 络 有 可 能 通 近 任意 的 复杂 连续 函数 ,所 以 人 工 神经 网 络 也 是 副 
近 非 线性 函数 的 重要 预测 工具 。 


已 知 输入 m 维 向 量 
X, = (Line Linney Te De TL Lh aet" ELi) G. 31) 

对 应 的 工 维 输出 向 量 为 
Vn = GnoasisZnenrsttitsYba) (5. 32) 


其 中 mn 一 Neo,No 十 1,…，N, 这 些 向 量 称 为 样本 ,通过 训练 (或 学 习 ) , 找 向 量 函数 C， 
使 

Yn = GG), n = Ne No 1, N (5. 33) 
这 时 BP 网 络 结构 如 图 5.1 所 示 。 
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图 5.1 多 变量 时 间 序 列 预 测 的 BP 网 络 图 


上 述 BP 网 络 结构 图 中 ,有 m 个 输入 节点 ,个 输出 节点 , 隐 层 有 9 TU oh 
是 第 i 个 输入 节点 和 第 j 个 隐 含 节点 之 间 的 连接 权 值 , 忆 是 第 j 个 隐 含 层 和 第 
个 输出 节点 之 间 的 连接 权 值 。 则 神经 网 络 的 输入 输出 关系 为 


E f - 
zou = ($140, = f( Nets 31x24))  & 152,5. 6.30 

jT iv iml 
其 中 输入 ti = Tins zz = Liars Tm = Liames Tt = han 


Lm bcm 1425 pace Em T XL on — 100, BOR fous. 

通过 n=No,No 十 1,… N 个 样本 的 训练 后 ,函数 G 就 由 网 络 中 的 权 值 以 和 
«n, E. HERA RT ELTE EHE nore Rir tires "E 002 BE nuns 
Xirs ,XT1.T+P 的 预测 值 。 

单 变量 时 间 序 列 情形 下 基于 神经 网 络 的 预测 方法 的 应 用 可 见 文献 Cat 201, 利 
用 神经 网 络 进行 预测 的 其 他 方法 还 有 小 波 神经 网 络 模型 "n” "91、 模 糊 神经 网 络 预 
测 模型 04~ ne 等 。 


5. 2. 3 ” 径 向 基 范 数 预 测 法 


BP 网 络 为 全 局 通 近 网 络 ,在 用 于 函数 逼近 时 , 权 值 的 调整 采用 梯度 下 降 法 , 存 
在 收敛 速度 慢 、 局 部 极 值 等 缺点 。 径 向 基 函 数 神经 网 络 为 局 部 逼近 网 络 , 对 于 每 个 
输入 输出 数据 时 ,只 有 人 少量 的 权 值 需要 调整 ,具有 学 习 速度 快 的 优点 ,因此 径 向 基 
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RM PEERED RES 2] ERE SH IRIS CT. BP 网 络 。 
径 向 基 函 数 预 测 模型 为 (以 预测 第 一 个 变量 为 例 ) 


N, 


xu = Gi) = D apl IE x — 6l) n — NoNo +1,1, N (5.35) 


mi 


EP eG) R* —R ERER — PROBUS 


g(r) = exp 


E 
203 
式 中 ,0; FAR PR BEBE sc) j= 1.2 NO EE AY FD LAG 1.2, 
N.) 是 待定 常数 。 
径 向 基 函 数 预 测 模型 中 待 确定 的 参数 有 两 类 : 径 向 基 函 数 的 中 心 点 (=1， 
2,…,N.J) 和 宽度 o(j 一 1,2,…,No) ;待定 常数 入 (j 二 1,2,…,N.)。 有 不 少 方法 来 
确定 这 两 类 参数 。 


l. 径 向 基 范 数 的 中 心 点 和 宽度 的 选择 


基本 思想 :利用 输入 样本 来 计算 Ne 个 cj(j==1,2,…,NN。) ,目的 是 使 o 尽 可 能 
均匀 地 对 输入 数据 抽样 ,使 c; 能 够 反映 输入 向 量 在 输入 空间 的 分 布 情况 ,在 输入 
向 量 集中 的 地 方 选中 的 cy 也 多 ,因此 径 向 基 函 数 中 心 的 选择 就 是 对 输入 特性 认识 
和 分 类 的 过 程 。 径 向 基 范 数 的 中 心 点 和 宽度 的 选择 方法 常用 的 有 开 - 均 值 聚 类 算 
法 ce Wil C 均值 算法 4 10 Kohonen 自 组 织 神经 网 络 法 55 。 

(1) 天- 均值 聚 类 算法 

这 是 一 种 无 监督 的 学 习 算 法 ,具体 步骤 如 下 : 

步骤 1: 初 始 化 聚 类 中 心 cj(j==1,2,…,N.)。 一 般 是 从 输入 样本 {x,) m Ne, 
No 十 1,…,N) 中 选择 一 个 样本 作为 聚 类 中 心 了 

步骤 2: 将 输入 样本 按照 最 邻近 规则 分 组 ,即将 输入 样本 Os) (n= Noy 
N 十 1,…，,N) 分 配给 中 心 为 cj(j=1,2,…，, Ne) 的 输入 样本 聚 类 集合 007 一 1,2，， 
NO , 亦 即 x,E 6; 且 满 足 

d; = min || x, — e| n= No, No b lens Ns jm 1,250 NS (5.37) 


步骤 3: 计 算 9; 中 祥 本 的 平均 值 即 聚 类 中 心 
= M 219. (5.38) 


(5. 36) 


式 中 ,Mj 为 0; 的 输入 样本 数 。 
步骤 4: 重复 上 述 步 又 ,直到 聚 类 中 心 不 再 变化 为 止 。 
聚 类 中 心 确定 后 ,可 由 下 式 计 算 宽度 oj(j 一 1,2,…,N。), 即 


= 让 Dr? (5. 39) 
4 
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(2) 8E C 均值 算法 
设 输入 样本 {x,) QU Nos Noob 1, NAAR NL 类 ,用 一 个 NX CN 一 No) 
矩阵 U 来 表示 分 类 结果 ,U 中 的 元 素 wu 为 


1,3 z, € A, Bt 
Um = 0,34 z, GA, E (5. 40) 
式 中 ,4, 表示 第 7 类 。 
算法 的 具体 步骤 如 下 : 
PR 1 :确定 聚 类 类 别 数 ,2 和 Ne<N 一 No。 
GR 2: 预 置 允许 误差 e。 
步骤 3: 任 意 指定 初始 分 类 和 矩阵 U* 5 —0. 
步骤 4: 根据 避 和 下 式 计算 Ne 个 中 心 5G=1,2,…，No): 
(5.41) 


步骤 S Het FARER U’ HU", 
1,% dh = (‘min (di) 时 


0, 其 他 


e 一 j=1,2 Neg n= Not lm N 
(5. 42) 
式 中 ,drn= || x 一 cj 上, 即 第 个 样本 x, 到 第 j 个 中 心 e; 之 间 的 距离 。 
BR 6: 以 一 个 合适 的 矩阵 范 数 比较 加 和 UY', 若 上 U0 一 U*+! || <e, RU PIE 
否则 置 b=b 十 1, 返 回 到 步 又 4。 
此 时 ,宽度 0,(j— 1,2, , NO Bx C. 43) 1838] 


NN 
= D ud, (5. 43) 
y. 
a 
(3) Kohonen 自 组 织 神经 网 络 法 
基本 思想 :将 输入 样本 {x,) (n 二 No, No 十 1,… ,NN) 选 择 为 用 于 构造 模型 的 学 
习 点 集 ,选择 输入 层 由 m 个 神经 元 组 成 ,分 别 对 应 x, 的 m 个 分 量 ,输出 层 直 接 取 
成 N, 个 神经 元 ,表示 希望 产生 的 中 心 个 数 ,每 个 输出 神经 元 都 与 m 个 输入 神经 元 
直接 连接 ,其 连接 权 为 wlan) G—1,2, s mij-1,2, NO ,采用 常规 的 学 习 算 
法 ,调整 w(n) 直 至 其 收敛 ,把 每 一 输出 神经 元 对 应 的 最 终 稳定 的 权 向 量 w (j==1， 
2, NOTE BUB BUS toD A e;G—1,2, NO. 


2. RÉK AL 的 求法 ; 
求 待定 常数 A BT ERRAT ORE RADI. 
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(1) 矩阵 算法 
在 确定 了 径 向 基 函 数 的 中 心 点 和 宽度 后 , 求 AG — 1,2» NO ,使 
N Ne 
3 [na Xue lx — ell) T 5. 44) 
z x ^a 名 
最 小 。 由 最 小 二 乘法 可 知 , 若 记 
y = [Eint Zine] E RN (5.45) 
A= [h sào sAn € RN (5. 46) 
= [aj] € RANON (5. 47) 
其 中 
aj-9K(dM0x,—cel) i= No 十 1,No 十 2 Ni jo 12s Ne 
(5. 48) 
则 可 从 以 下 矩阵 方程 求 A/G 1,2, NO, Bl 
y — Xà (5. 49) 
因此 当 ATA 可 逆 时 ,有 
A= (XTX) X'y (5. 50) 


M. Casdagli "5? fe f 5 4e £5 [5] AE GR CH F TRE Bt [8] 39] 86) BERE RT dU Ac, 
CGj1,2, NRA VII SIE P BY TAR BD c= x, G — No 1 No +2, IND IG 
时 ,矩阵 A 为 方 阵 , 因 此 得 

A- Xy (5.51) 
这 样 做 的 缺点 是 在 每 一 个 中 心 点 都 精确 地 拟 合 了 ,因此 对 一 些 含 噪声 的 数据 ,往往 
会 导致 拟 合 过 度 ,不 能 很 好 地 体现 动力 系统 内 在 的 规律 性 .另外 ,对 有 些 数据 ,4 往 
往 会 呈现 奇异 性 ,从 而 无 法 求 出 4。 

(2) 迭代 算法 

设 输入 样本 为 x(n =No, No1, N) ,对 应 的 输出 值 为 zw+t(a 一 No 十 1， 
No 十 2,…，N) ,使 能 量 函 数 


N N, 
g-i È, [ns - Yael lx. — el T (5.52) 
LEN ET 
N N, 
wat M alam Sex 6l Jeli — el) 
(5.53) 
式 中 ,7 为 学 习 率 。 


在 确定 了 所 有 参数 后 , 则 后 P 个 数据 zi.w+s4p 二 1,2,…,P) 的 预测 值 zs, 
(p —1,2,7, P) 
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N, 
Eines = SAC arima — el}, p= 1,2, P (5.54) 
而 模型 的 拟 合 精度 可 由 下 面 的 拟 合 均 方 误 差 表示 , 即 
= xx M Gua 602 (5.55) 
One Ng +1 


5.3 各 种 预测 方法 的 预测 效果 对 比分 析 


针对 前 面 提出 的 各 种 局 域 和 全 局 预测 方法 ,它们 的 预测 模型 是 否 精确 ,预测 的 
效果 如 何等 是 需要 进一步 探讨 的 问题 ,为 此 将 引入 预测 效果 的 评价 指标 ,并 通过 已 
知 模型 进行 仿真 分 析 。 


5.3.1 预测 效果 评价 


为 了 检验 预测 的 精确 性 ,可 以 通过 比较 预测 值 zi,r+: 与 观测 值 zxr+i, 定 义 预 
测 误差 为 zir+: 与 zir+t 的 差 。 一 次 预测 可 能 较 好 或 较 差 , 偶 然 性 较 大 ,为 了 克服 这 
种 偶然 性 ,可 以 取 多 个 点 的 预测 误差 的 平均 。 

设 zur+yzur+2y…yzur+p 的 预测 值 为 zir+iyzir+…yzur+Py 定 义 均 方 根 误 
Æ (root mean squared error，RMSE ) 为 


RMSE = BD Unas, = iurs)? (5. 56) 


或 均 方 误差 (mean squared error, MSE) 4 
P 
MSE = $3 Gras — duri 6.57 


p=1 


如 果 均 方 根 误差 RMSE EHI 7r i8 3€ MSE) 非 常 大 ,意味 着 预测 不 好 ,因此 时 
间 序 列 不 是 来 自 于 确定 性 系统 ;反之 ,如 果 均 方 根 误 差 RMSE (或 均 方 误差 MSE) 
较 小 ,说 明 时 间 序 列 来 自 于 确定 性 系统 。 衡 量 均 方 根 误差 RMSE (或 均 方 误差 
MSE ) 的 大 小 ,仅仅 从 均 方 根 误差 RMSE (或 均 方 误 差 MSE) 的 数据 本 身 无 法 确 
定 , 因 为 均 方 根 误差 RMSE (或 均 方 误差 MSE) 与 观测 数据 {zx1.,} 的 数值 大 小 有 关 ， 
因此 在 不 同 问题 中 的 数量 级 是 不 一 样 的。 为 了 解决 这 一 问题 ,考虑 如 果 每 一 时 刻 
THp p=1, 2, Pr zitti" ,TLT+P 都 取 相 同 的 预测 值 rr ,使 平均 预测 

P 

BIE = BD Gus 40? obs Wii Boh Res An 


p=1 


^ 1 E 
i = p Dare (5. 58) 


p=1 


即 这 样 的 预测 是 后 P 长 时 间 序 列 的 均值 ,因此 此 时 的 平均 预测 误差 e* 就 是 后 P 
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长 时 间 序 列 的 方差 o*, 由 于 这 种 预测 是 比较 差 的 ,因此 可 用 均 方 根 误差 RMSE 与 
方差 o 进行 相对 比较 , 即 定 义 正规 化 均 方 根 误差 (normalized root mean squared 
error, NRMSE) 为 


NRMSE = 


RMSE 
— (5. 59) 


或 用 均 方 误差 MSE 5 e' =o" 进行 相对 比较 , 即 定义 正规 化 均 方 误差 (normalized 
mean squared error, NMSE) 为 


NMSE = MSE (5. 60) 


式 中 ,o 是 {x1,7+p)p-! 的 方差 。 

车 正规 化 均 方 根 误差 NRMSE (或 正规 化 均 方 误差 NMSE) 接 近 于 1, 则 表明 
均 方 根 误差 RMSE (或 均 方 误差 MSE) 较 大 ; 若 正规 化 均 方 根 误差 NRMSE( 或 正 
规 化 均 方 误差 NMSE) 接 近 于 0, 则 表明 均 方 根 误差 RMSE (或 均 方 误差 MSE) 较 
小 59。 


还 可 以 用 下 面 的 相关 系数 来 检验 预测 的 效果 ,定义 相关 系数 为 


P 


P P 
D tinest — DI Tints Thntrp 
2=1 一 2=1 


— P P E E. B ; 
dame Sas uf Sl des — Tias) 
则 0<r<1,7 越 接近 1 表示 预测 效果 越 好 。 
5.3.2 仿真 比较 


为 了 比较 各 种 预测 方法 之 间 的 预测 效果 、 同 类 预测 方法 单 变 量 时 间 序 列 和 多 
变量 时 间 序 列 预 测 方 法 之 间 的 差异 以 及 时 间 序 列 长 度 对 预测 效果 的 影响 等 ,下 面 
通过 一 个 仿真 例子 来 详细 分 析 。 


(5. 61) 


考虑 Lorenz 系统 
us = ola, — n) 
S I n — z) — r (5. 62) 


3 
— xir, — bx, 


其 中 o=10,r=28,6=4., 取 21515. 34,zz.o 一 13. 68523, 737. 91, ASE K h= 
0. 04。 利 用 四 阶 Runge-Kuta 积分 法 计算 出 两 个 包含 12 100 个 数据 的 仿真 时 间 序 
列 z, 和 zz。 为 了 减 小 瞬 态 的 影响 ,去掉 前 10 000 个 数据 , 剩 下 的 2100 个 数据 中 ， 
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前 2000 个 数据 用 来 训练 样本 ,后 100 个 数据 作为 预测 集 。 

对 单 变量 时 间 序 列 {z1..)33, 利 用 互信 息 最 小 法 计算 得 最 佳 延 迟 时 间 r 一 4, 如 
图 5. 2 所 示 ; 利 用 虚假 最 近邻 点 法 得 最 小 嵌入 维 数 取 思 一 3, 如 图 5. 3 所 示 。 因 此 ， 
X Se BERE T8] FFE (ns) 2099 ,做 以 下 相 空 间 重 构 


Xn = Gnaszya-isZia-i) (5. 63) 


平均 互信 息 


时 间 缅 迟 
图 5. 2 ”利用 平均 互信 息 法 求 延 迟 时 间 


FNN 的 百分数 


图 5.3 利用 虚假 最 近邻 点 法 求 贱 入 维 数 


Net PE E TT) FFA rae Toe OT, H 4.3.4 AR n — 0 —4 m —2, 
ma 一 1, 因 此 , 作 以 下 相 空间 重 构 


Xn = (Lins Tina Tzn) (5. 64) 
ALFA RIT TB) Jy R F N E ARRET A 8 £8 P tU A 8 18] 3 eR & 
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预测 法 HARG. 63) 和 式 (5. 64) 的 单 变量 和 多 变量 重 构 ,分别 预 测 变量 zi 的 最 
后 100 个 值 , 即 预 测 {z1.zooo+s) 冯 1 预测 的 均 方 根 误差 RMSE、 正 规 化 均 方 误差 
NMSE 和 相关 系数 ~ 见 表 5.1。 同 时 为 了 说 明 数据 长 度 对 预测 效果 的 影响 , 表 5. 1 
中 多 变量 1 RRM Cain Zen) PAB (21.0 Moor» BBE 2 减少 了 一 半数 据 , 即 
FB (Carns Lan) IPSE 1000 4 3G {21.0 sn 9o BE 2299... JE OESTE BI 
法 和 局 部 线性 预测 法 中 取 最 近邻 点 数 玉 一 12, 神 经 网 络 预 测 法 中 网 络 的 隐 层 数 为 
8 ,训练 次 数 为 1000 K, 


表 5.1 各 种 预测 方法 预测 误 束 比较 


预测 方法 均 方 根 误差 RMSE 正规 化 均 方 误差 NMSE 相关 系数 ~ 
单 变量 0. 2297 8.5133 10-* 0. 9896 
局 部 平均 = 
预测 法 多 变量 1 0. 1260 2. 5620X 10-* 0. 9899 
多 变量 2 | 0.1792 5. 1807 X 107* 0. 9898 
单 变量 0. 0166 4. 6931 X 107* 0. 9900. 
* 多 变量 1 0. 0027 1.1364 X 107? 0. 9900 
预测 法 = —— 
多 变量 2 0. 0040 2.5874 X 1077 0. 9900 
单 变量 0. 0424 2.9041 X 1075 0. 9900 
神经 网 络 十 
sx E23 S! 0. 0037 | 2. 2178 X 1077 0. 9900 
q 多 变量 2 | 0. 0047 3. 1490x 1077 0. 9900 
单 变量 0.0021 9. 5542X 107* 0. 9900 
[LETT [- 
预测 法 多 变量 1 0.0013 3. 3002 x 10-* 0. 9900 
多 变量 2 0. 0018 6. 3321 X 107* 0. 9900 


从 表 5. 1 可 以 得 出 :在 已 知 数据 长 度 相等 的 情况 下 ,无 论 用 什么 预测 方法 ,多 
变量 重 构 预 测 都 要 比 单 变量 重 构 预 测 好 得 多 ,即使 多 变量 重 构 时 只 用 单 变量 重 构 
的 一 半数 据 ,多 变量 预测 也 比 单 变量 预测 要 好 。 因 此 ,在 历史 数据 长 度 比 较 短 的 情 
况 下 ,利用 多 变量 重 构 也 有 可 能 获得 较 高 的 预测 精度 。 

为 了 更 具体 地 说 明 选 择 不 同 的 多 变量 对 预测 效果 的 影响 ,我 们 以 用 神经 网 络 
预测 法 预测 变量 zi, 的 最 后 100 个 值 为 例 详细 说 明 。 这 里 取 隐 层 节点 数 是 8, 迭 代 
进行 1000 次 。 对 单 变量 时 间 序 列 重 构 (zi.o,zi。 yzk-s)、 两 变量 时 间 序列 重 构 
(Criwyziw_iyzaw) 和 (zinyzio-iyzas) 分 别 进行 预测 ,预测 的 均 方 根 误差 RMSE、 正 
规 化 均 方 误差 NMSE 和 相关 系数 ~ 见 表 5. 2。 


表 5.2 不 同 变量 下 神经 网 络 预 测 法 预测 误 束 比较 


变量 均 方 根 误差 RMSE | ”正规 化 均 方 误差 NMSE 相关 系数 
Gris zia-asZia-8) 2. 9041X1075 | 0. 0424 0. 9900 
(aime Lint 2,8) 2.2178X 1077 0. 0037 0. 9900 
[CIE EE 8. 8101 X 107* 0. 0234 0. 9900 
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AR 5. 2 中 数据 可 见 , 无 论 是 用 两 变量 (zi。,zrz*) 重 构 还 是 用 两 变量 (zi， 
zawm) 重 构 , 预 测 的 效果 都 好 于 仅 用 单 变量 z1., 预 测 的 效果 ;用 两 变量 (zz, ,) 重 构 
的 状态 向 量 (zzi*-syzz。) 预 测 的 正规 化 均 方 误差 比 仅 用 单 变 量 zi,, 重 构 的 状态 
向 量 (zi,zkuw-4yziw-s) 预 测 的 正规 化 均 方 误差 低 两 个 数量 级 ,这 说 明了 适当 选择 
多 变量 做 预测 可 明显 提高 预测 效果 .另外 ,同样 是 用 两 变量 ,但 用 两 变量 (zzz) 
重 构 要 比 用 两 变量 (zi,zs,*) 重 构 预测 好 ,所 以 适当 选择 变量 对 预测 也 是 很 重 
要 的 。 

最 后 来 比较 多 变量 多 项 式 预 测 与 其 他 预测 方法 的 预测 效果 。 对 单 变量 时 间 序 
I Gc, Ve ,做 式 (5. 63) 的 相 空间 重 构 。 取 ;二 2,p 二 1, 得 单 变量 时 间 序列 一 步 预 测 
的 二 阶 多 项 式 预测 模型 

pre) 6, Gr) 

Seo + tir + GPT- + Pairs + chri + Maret 
+ citrar- + eitir- + cHinnr-ersr-s + Tir» (5.65) 

Ret PG AS HBR HE TE) FP (Cs ya) 12 HER CS. 64) 的 相 空间 的 重 构 。 取 s=2,p=1 

得 两 变量 时 间 序 列 一 步 预 测 的 二 阶 多 项 式 预测 模型 


Tirts T6 Cer) 


一 co + cY Tr + Paria + erir + TTT-a + RTH 
十 cid zor + citar (5. 66) 
取 最 近邻 点 数 K —100, BOR 2 E A P —100, BUM UE 5. 3 所 示 。 


ss 单 变量 与 多 变量 时 间 序 列 局 部 多 项 式 预测 法 预测 结果 比较 


非 线性 时 间 序 列 
单 变量 r 
EMG. yn) 


从 表 5. 3 的 结果 可 知 ,基于 多 变量 重 构 相 空间 的 局 部 多 项 式 法 预测 效果 明显 
优 于 基于 单 变量 重 构 相 空间 的 局 部 多 项 式 法 的 预测 效果 .进一步 ,将 多 变量 时 间 序 
列 局 域 预测 法 中 三 种 预测 方法 对 以 上 同 组 数据 的 预测 结果 进行 比较 ,预测 结果 如 
表 5.4 所 示 。 


模型 均 方 根 误差 RMSE 


0.0071 


正规 化 均 方 误 差 NMSE 
8.0314X 1077 
2. 2941x1078 


局 部 多 项 式 预 测 法 


0.0012 


表 5.4 多 变量 时 间 序 列 三 种 局 域 预测 法 预测 结果 比较 
模型 均 方 根 误差 RMSE 正规 化 均 方 误差 NMSE 
局 部 平均 预测 法 0. 5421 | 0. 0047 
局 部 线性 预测 法 0.1400 | 3.1360x 1076 
局 部 多 项 式 预 测 法 0.0012 | 2. 2941 X 107* 
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从 表 5. 4 的 结果 知 ,基于 多 变量 重 构 相 空间 的 局 部 多 项 式 法 预测 效果 明显 优 
于 局 部 平均 预测 法 和 局 部 线性 预测 法 的 预测 效果 。 因 此 ,给 出 的 多 变量 时 间 序 列 的 
局 部 多 项 式 预测 法 是 一 种 更 好 的 局 部 预测 方法 。 


5.4 基于 正则 化 的 多 变量 非 线 性 时 间 序列 预测 方法 


在 前 面 所 研究 的 局 部 线性 预测 法 、 局 部 多 项 式 预测 法 和 径 向 基 函 数 预测 法 中 ， 
都 遇 到 了 如 下 的 线性 回归 问题 : 
y=Xe+e (5. 67) 
RH, e 是 误差 向 量 ,满足 ECe)=—0,Var(e)=o'l. 
当 久 的 列 向 量 线性 无 关 时 ,用 普通 最 小 二 乘法 获得 待 求 向 量 c 的 无 偏 估计 ， 
得 到 该 问题 的 唯一 解 
Cos = (XTX) X'y (5. 68) 
当 X 的 列 向 基线 性 相关 时 ,X"X 是 奇异 的 ,此 时 < 的 估计 不 唯一 。 然 而 ,这 种 
情况 在 应 用 中 很 少见 ,更 一 般 的 情形 是 X 的 列 向 量 近似 线性 相关 , 即 存在 多 重 共 
线性 。 正 如 XX 的 列 向 量 线性 相关 导致 X'X 的 奇异 性 ,XX 的 列 向 量 近 似 线性 相关 就 
会 导致 XYX 的 近似 奇异 性 。 
奇异 性 可 以 定义 为 :存在 一 个 单位 向 量 c( 即 | e li=1), 使 得 Xe 一 0 或 写成 
cTXTXc 二 0。 我 们 可 以 给 近似 奇异 性 归纳 出 如 下 特点 ,就 是 存在 一 个 单位 向 量 c 使 
得 | Xe |] $—c X" Xe 非常 小 。 当 近似 奇异 性 存在 时 ,最 小 二 乘 估计 的 方差 会 非常 
大 ,估计 的 效果 非常 差 .为 了 解决 这 一 问题 ,下 面 给 出 改进 的 最 小 二 乘 估计 , 即 正则 
化 估计 。 
为 了 解释 多 重 共 线性 导致 最 小 二 乘 估计 变 坏 的 原因 ,也 为 正则 化 估计 做 准备 ， 
先 给 出 矩阵 的 奇异 值 分 解 的 概念 。 


5.41 奇异 值 分 解 


任何 一 个 矩阵 天 都 能 写成 三 个 简单 甜 阵 的 乘积 , 称 为 于 的 奇异 值 分 解 (singu- 
lar value decomposition, SVD) ,这 就 是 下 面 的 奇异 值 分 解 定理 se 157, 
RAD BEB. XERO”, WEER U = [u ue JER AV = 
Dn ves» JER ,使 
X-Uzv' (5. 69) 
X UTU =1,V"V =1, 5=diag (01,02, 00, H 0, SoS >So, >0,r=min{ky 
m). 


由 奇异 值 分 解 定理 可 得 
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2, vi 
z E 
X = [uius sns] x ” j= S ouv? (5. 70) 
: i=l 
or br 
值 空间 
R(X) = spaníu, uz, ,u,} C R* (5.71) 
R(X") = span {v; v; 7 sv} C R” (5. 72) 


通常 将 子 空间 R(K) 看 成 输出 空间 ;R(XK7) 看 成 输入 空间 。 
式 (5.70) 完 全 揭示 了 和 矩阵 X 作用 于 一 个 向 量 e 所 产生 的 多 重 共 线 性 。 例 如 ， 

取 c=w, 由 于 VD=1, 即 . 

DN Ghi jet 


"ho uin (5.73) 
从 而 有 
= Youviv, = cy, (5.74) 
更 一 般 地 , 设 EET 
Xe= Some H Xer) = Seu (5.75) 


因此 ,向 量 e 在 方向 内 上 的 一 个 微小 变化 仅 对 乘积 Xe 在 方向 由 上 产生 影响 。 可 以 
说 成 输入 空间 中 的 每 个 方向 vj 联系 着 输出 空间 中 的 一 个 特定 方向 u, 这 种 联系 的 
紧密 程度 完全 取决 于 相应 的 奇异 值 oj。 例如, 若 0; 二 1000, 则 输入 方向 vy 上 的 一 个 
微小 变化 能 引起 输出 方向 ww 上 的 一 个 巨大 变化 。 若 a 二 0, 则 输入 方向 v, 上 的 变化 
对 输出 方向 wj 没有 任何 影响 。 

显然 ,最 大 与 最 小 奇异 值 之 比 总 是 大 于 等 于 1, 称 这 个 比值 为 矩阵 X 的 条 件 
数 , 记 为 7, 即 


— 
Y- a (5. 76) 


AAR HAAS FRB At HE Oy FEELS HE oa 相 比较 )。 假设 最 小 的 奇异 值 
满足 o, 020, t c v, REA Z PRN 183 v 对 应 奇异 值 r ,那么 由 Xv, = 
oru,，, 得 到 

lXell; = lXv.l2— low 2 = o, i u, ll = 0 ~ 0 (5.77) 
这 就 精确 地 表达 了 前 面 提 到 的 多 重 共 线性 。 换 句 话说 ,多 重 共 线性 意味 着 多 有 一 
个 非常 小 的 奇异 值 ,或 者 是 X 的 条 件数 非常 大 。 


5.4.2 最 小 二 乘 估计 
下 面 将 在 奇异 值 分 解 的 框架 内 推导 出 普通 最 小 二 乘 (ordinary least square, 
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OLS) 估 计 , 找 出 XTX 近似 奇异 时 导致 最 小 二 乘 估计 变 坏 的 原因 ,以 便 对 它 进行 
改进 。 


1. 最 小 二 乘 估计 的 奇异 值 分 解 表示 


对 线性 回归 模型 ?一 Ke 十 e, 将 矩阵 下 的 奇异 值 分 解 玉 =D23VT 代入 它 的 最 小 
二 乘 估计 cos= (CX) XT 中 ,得 到 


Cas = VE Uy (5. 78) 
也 可 写成 
fas = M eon, (5.79) 


HEH Cu y) =uly G= 1.2.0 KE y HERR u 上 的 长 度 , 叫 做 y 的 傅 里 
叶 系 数 。 

根据 Gauss-Markov 定理 ,最 小 二 乘 估计 在 线性 无 偏 估计 类 中 方差 最 小 。 因 
此 ,为 了 说 明 什么 情况 下 线性 无 偏 估计 的 性 质 明显 变 坏 , 提 出 一 个 度量 估计 优 劣 的 
另 一 个 标准 一 一 均 方 误 差 。 

2. 最 小 二 乘 估计 的 均 方 误差 

定义 均 方 误差 

MSE(c) = EL |ê — cli] (5. 80) 
这 里 采用 的 是 关于 c 的 随机 误差 的 期 望 , 式 (5. 80) 可 改写 成 
MSE) =EL || e~E[e]+E[e]—e || 3] 
=E[ || e—£[e] | i]o- 2E Cc— Ete" Ee] Jo- EL || Ele]—e | 2] 


=E[ || c~ EÇ] ?+ || ECe]—e ll? (5. 81) 
id 
bias(c) = E[c] — c (5. 82) 
Var(e) = EL le — Ete] 4] (5. 83) 
则 有 
MSE(c) = Var(e) + || bias(e) || 3 (5. 84) 


由 式 (5. 82) ,bias (Cors) =0, HR C5. 83) 
Var (Cors) = trCov(6os) = trCov(VE-!U y) 
= tr[V3-UTCov (UE-'VT] 
= u[e!'VZ-y!] 
= “> =] (5. 85) 
式 中 ,r EER X 的 秩 ;o? 是 基本 模型 ?一 Xe 十 e 中 噪声 项 e 的 方差 ,计算 中 用 到 了 
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Cov(y) 一 1。 于 是 最 小 二 乘 估计 的 均 方 误差 为 

MSEGas) = e» i (5. 86) 
由 式 (5. 860,24 X 的 列 向 量 间 存 在 多 重 共 线性 时 ,X 至 少 有 一 个 奇异 值 os 非常 小 ， 
这 就 导致 cors 的 均 方 误差 非常 大 ,由 (5. 84) 知 也 即 等 价 于 cous 的 方差 非常 大 ,从 而 
cors 估 计 变 坏 。 于 是 ,人 们 开始 考虑 最 小 二 乘 估计 的 改进 ,也 即 寻 找 新 的 估计 来 减 
小 方差 ,而 根据 Gauss-Markov 定理 ,最 小 二 乘 估计 在 线性 无 偏 估计 类 中 方差 最 
小 ,因此 在 这 种 意义 下 没有 其 他 的 无 偏 估计 方差 会 更 小 。Gauss-Markov 定理 并 没 
有 提 及 有 偏 估计 和 非 线性 估计 。 所 以 ,下 面 将 考虑 几 种 有 偏 估计 ,也 称 正则 化 估计 ， 
它 能 达到 减少 均 方 误差 的 目的 。 


5.4.3 正则 化 估计 


由 式 (5. 84), 均 方 误差 是 方差 与 偏差 平方 之 和 ,而 且 最 小 二 乘 估 计 的 偏差 为 
0, 因 此 要 想 获 得 比 最 小 二 乘 估计 更 小 的 均 方 误差 ,必须 在 减少 方差 的 同时 避免 引 


入 同等 数量 的 偏差。 由 式 (5.79), 即 os 一 Dy Sy, 可 以 看 出 , 较 小 的 奇异 值 o， 
对 最 小 二 乘 估计 的 影响 较 大 ,为 了 保持 估计 的 稳健 性 ,应 该 降低 这 样 一 些 方向 的 权 
值 。 为 此 ,对 最 小 二 乘 估计 作 如 下 修改 

= Da Gen, (5.87) 


它 与 最 小 二 乘 估计 的 唯一 不 同 之 处 是 在 每 个 方向 引入 了 一 个 权 值 , 称 作 过 滤 因 
F. E o 较 大 ,对 这 样 一 些 方 向 我 们 让 =1; 若 oi 较 小 ,对 这 样 一 些 方向 就 选择 较 
小 的 入 ,小 的 过 滤 因 子 会 消除 小 奇异 值 的 影响 ,从 而 均 方 误差 相对 于 最 小 二 乘 估 计 
而 言 就 会 减少 。 下 面 给 出 估计 式 (5. 87) 的 均 方 误差 表达 式 。 
将 式 (5. 87) 写 成 矩阵 形式 : 

€ — VX-AU!y (5. 88) 

其 中 
A = diag (ài ,A 7, À) 


APE SVS AU E[y] - VAV e T c 8908 LORIE ê= D Gov 
这 里 (wvc) 是 e 的 傅 里 时 系数 ,所 以 
|| biasCc) = I Ele] — e ll} = || WAV — Deli 


= Ya -D'G,o (5. 89) 
ft 
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Var(c) — trCov(c) = tr[VE~!AUTCov(y)UAZ-'V7] 
= u[e'VZ- WV] 
-e»d a (5. 90) 
xiu cres 
MSE) = Za — Dv,e)? + DE à (5.9) 


对 最 小 二 乘 估计 ,过 滤 因 子 Am 1,13 r ARGS. 91) 中 的 第 一 项 为 淮 , 从 而 
MSE(e) 减 少 到 式 (5. 86)。 从 式 (5. 91) 中 还 可 以 看 出 , 当 过 滤 因 子 入 从 1 开始 增加 
时 ,偏差 项 和 方差 项 都 随 之 增加 ,因此 MSE(e) 变 大 , 故 应 控制 AY HAL E OA, 
三 1; 当 为 从 1 减 小 到 0 时 ,偏差 项 增 大 了 ,但 方差 项 变 小 了 ,所 以 在 0~1 中 寻找 最 
FERI A 值 ,使 MSE(c) 达 到 最 小 是 有 待 研究 的 问题 。 

下 面 结合 A 的 取 值 介绍 几 种 正则 化 估计 ,它们 都 具有 比 最 小 二 乘 估计 更 小 的 
均 方 误差 。 


l. 主 成 分 回归 估计 


由 于 最 小 的 一 些 奇异 值 使 得 最 小 二 乘 估计 方差 变 大 ,为 了 降低 这 种 影响 ,从 最 

小 二 乘 估计 的 表达 式 中 去 掉 这 些 项 ,也 就 是 在 式 (5. 79) 的 和 式 中 去 掉 第 q 项 之 后 

的 项 (因为 最 后 的 这 些 项 对 应 最 小 的 奇异 值 ), 对 应 的 估计 叫做 主 成 分 回归 (princi- 
pal components regression, PCR) ftiit , ja E 

=> Son, (5. 92) 


ie 


注意 到 对 应 截断 点 9 的 不 同 选择 ， 我 们 能 得 到 许多 PCR 估计 。 对 应 截断 点 为 4 的 
PCR 估计 记 成 PCR(9), 数 o 在 估计 中 常 称 作 因子 数 。 


易 见 PCR(9) 估 计 的 过 滤 因子 为 
uie ted (5.93) 
= lo +1<i<r ` 
将 其 代入 式 (5. 91) ,得 到 PCR GO HT 89397713 25 79 
MSE rro) = 10 + et Y] = (5. 94) 
a e a 
要 使 
MSE (ici) < MSE(cous) (5.95) 
RA 


x Gic) <a? xi (5. 96) 


itv EI 
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对 于 PCR(9) 估 计 , 由 于 和 的 后 rg 个 奇异 值 接近 于 零 , 所 以 式 (5. 96) 右 端 非常 
大 , 即 不 等 式 (5. 96) 总 是 成 立 的 。 也 就 是 说 ,PCR(9) 估 计 的 均 方 误 差 总 比 最 小 二 乘 
估计 的 均 方 误差 小 。 

对 于 PCR(9) 估 计 , 参 数 4 的 选取 是 关键 。 其 中 最 常用 的 是 交叉 校 验 (cross- 
validation，CV) 和 广义 交叉 校 验 (GCV)Ds; 还 有 更 简单 确定 9 的 方法 ,就 是 利用 
奇异 值 谱 (奇异 值 谱 中 明显 的 间隙 处 对 应 的 值 取 作 a) REOR X 的 某 些 奇异 值 之 
和 占 整 个 奇异 值 之 和 的 比例 达到 预先 给 定 的 值 (一 般 取 大 于 等 于 8090097, fei 
沌 时 间 序列 的 应 用 中 ,CV 常常 会 过 估 正 则 化 参数 。 至 于 利用 奇异 值 谱 选取 PCR 
的 参数 q, 在 谱 中 很 少 会 出 现 一 个 明显 的 间隙 。 利用 比例 计算 gq 也 不 是 一 个 很 严格 
的 标准 ,这 是 由 于 g 的 估计 会 随 着 m 一 起 改变 。 文 献 [157] 给 出 了 一 个 较 好 的 方 
法 , 即 对 非 线性 动力 系统 ,如 果 系 统 中 吸引 子 的 拓扑 维 d 能 够 估计 出 来 , 则 对 固定 
的 9 值 建议 取 

q = [4] (5.97) 
式 中 :[d] 是 大 于 d 的 最 小 整数 。 


2. 岭 回归 估计 


最 小 二 乘 估计 是 对 问题 || y— Xe || 2 极 小 化 得 到 的 ,在 多 重 共 线性 情况 下 , 式 
《5.79) 中 某 些 o, 非常 小 ,所 以 cors 的 范 数 非常 大 ,为 避免 这 种 情况 发 生 , 我 们 改 成 
极 小 化 问题 

He) |ly— Xel? + alleli (5. 98) 
式 中 ,是 一 个 正常 数 。 这 样 做 的 目的 是 惩罚 大 范 数 || ell ,人 迫使 解 的 范 数 变 小 。 由 
此 得 到 的 估计 叫做 岭 回归 (ridge regression, RR){HitU, AA RR 估计 为 
ee = (XTX + pIXTy (5. 99) 
式 中 ,7 为 单位 阵 。 HX 008 SP LITE X =UV 代入 式 (5. 99) ,得 
cg 一 (YZ2VT + aD) 2 VXU! y 


MK 
- z pau (5. 100) 
RR 估计 的 过 滤 因 子 为 


o + # 
因为 p> 0,8 OSA<1, AE RR GET TERED 77 181 EAB TR LE AH HEAT T E 
缩 。 将 式 (5. 100) 代 入 式 (5. 91) ,得 到 RR 估计 的 均 方 误差 为 


rs 24 gt r4 
MSE (êr) = X raum LEA 3 CEN (5. 102) 
对 找到 的 一 个 ww, 当 c 和 到 满足 一 定 条 件 时 有 ,MSE (Cnr)  MSE Cors) RÈI o 


A= (5. 101) 
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对 于 RR 估计 ,参数 w 的 选取 是 关键 。 对 x 可 简单 取 作 残 差 方差 的 估计 o XR 
差 方差 的 估计 为 


Me Pa Se — Xel2— — uty — xe ||? 
a= pee = ply Xeli- g— ll Uy —- U'Xelt 


= poo duty — utxwee |: 


— 
“kor 


p à 
=; t [3 od — eto + >) (uly)? 
E iei 


uty — ZV'elit 


i 
rh Vay (5.103) 


itn 


3. 其 他 正则 化 估计 


正则 化 估计 还 有 偏 最 小 二 乘 估计 Ce 特征 根 估计 等 。 如 果 能 适当 引入 某 种 过 
滤 因 子 使 得 相应 的 均 方 误差 比 最 小 二 乘 估计 的 均 方 误差 MSE(cous) 小 ,还 可 以 得 
到 新 的 正则 化 估计 。 


5.4.4 基于 正则 化 的 局 部 线性 和 局 部 多 项 式 预 测 的 步骤 


基于 前 面 的 研究 ,下 面 将 从 消除 多 重 共 线性 的 角度 引入 正则 化 参数 ,对 多 变量 
局 部 线性 预测 法 和 局 部 多 项 式 预 测 法 进行 改进 ,最 终 提 高 非 线 性 时 间 预 测 法 的 预 
测 精度 。 

多 变量 局 部 线性 预测 法 和 局 部 多 项 式 预测 法 , 均 是 先 建立 模型 ,然后 用 最 小 二 
乘 估计 进行 模型 参数 的 估计 。 在 这 两 种 局 部 预测 法 模型 建立 中 都 需要 选取 邻 点 
及, 目前 还 没有 统一 的 选取 方法 ,对 局 部 线性 预测 法 常用 的 方法 是 文献 [123] 中 提 
出 的 方法 ,这 种 方法 实际 上 确定 了 K 在 2m--1 至 2m 十 10 中 取得 ,也 即 Kom. XT 
局 部 多 项 式 预测 法 为 了 得 到 稳定 的 解 ,一 般 要 求 满足 KJ Kp J 为 由 式 (5. 24) 
给 出 的 待定 系数 的 个 数 ,与 多 项 式 的 阶 数 * 有 关 。 实 际 上 ,将 非 线性 时 间 序 列 映射 
到 高 维 相 空间 中 ,尽管 有 利于 消除 噪声 等 因素 造成 的 “ 伪 邻 近 点 ”, 但 由 于 实际 问题 
中 样本 总 是 有 限 的 ,因此 有 时 在 相 空间 中 某 些 点 上 却 不 能 找到 足够 数目 的 邻近 点 ， 
因而 有 时 条 件 Kom OS BARE) SX 天 过 J( 局 部 多 项 式 预 测 时 ) 并 不 一 定 能 
够 达到 。 当 天 接近 普 或 了 时 ,最 小 二 乘 估计 变 得 很 不 稳定 ,这 时 正则 化 估计 的 作 
用 很 明显 。 尤 其 当 K<m 或 KJ 时 ,正则 化 估计 中 的 PCR 估计 的 作用 尤其 明显 ， 
这 是 因为 即使 相 空 间 的 维 数 m 较 大 ,回归 问题 的 实际 维 数 仍 较 稳定 ,大 小 与 9 相 
同 ,因此 由 PCR 获得 的 解 是 稳定 的 。 

另外 ,由 于 实际 问题 所 观测 到 的 数据 中 总 是 含有 噪声 的 , 当 观 测 数据 中 引入 了 
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测量 噪声 时 ,尽管 这 时 和 矩阵 的 条 件数 总 是 较 适 中 的 ,但 由 于 OLS 解 中 的 部 分 方 
向 被 噪声 履 盖 ,未 来 的 状态 没有 包含 真正 有 用 的 信息 ,所 以 OLS 的 预测 能 力 退 化 
了 ,而 正则 化 估计 可 以 有 效 地 过 滤 掉 解 中 的 这 些 方向 。 因 此 ,正则 化 估计 对 于 实际 
问题 具有 明显 的 改进 作用 。 

下 面 将 对 多 变量 局 部 线性 预测 法 和 局 部 多 项 式 预测 法 进行 改进 ,得 到 新 的 预 
测 方法 。 其 步骤 如 下 : 

第 一 步 :根据 4. 3 节 给 出 的 方法 选取 时 间 延 迟 = HRA SER mi; 重 构 相 空间 。 

第 二 步 : 给 定 一 个 合适 的 邻近 点 数目 到, 并 找 出 与 当前 点 最 近 的 K 个 邻近 点 。 

第 三 步 :根据 式 (5. 97) 及 式 (5. 103) 确 定 正则 化 参数 g 或 x 的 值 。 

第 四 步 : 根 据 式 (5. 79)、 式 (5. 92) 及 式 (5. 100) 分 别 做 出 c 的 估计 。 

第 五 步 :对 多 变量 局 部 线性 预测 ,根据 式 (5. 8) 式 做 出 预测 ;对 多 变量 局 部 多 项 
式 预测 ,根据 式 (5. 19) 做 出 预测 。 

第 六 步 :对 新 的 目标 点 ,重复 第 一 步 至 第 五 步 直到 结束 。 

以 上 基于 正则 化 回归 的 一 般 局 部 线性 预测 和 局 部 多 项 式 预测 与 基于 最 小 二 乘 
回归 的 一 般 局 部 线性 预测 和 局 部 多 项 式 预 测 的 方法 是 相同 的 ,区 别 仅 在 于 对 回归 
问题 的 参数 选用 的 估计 式 不 同 , 对 于 不 同 的 研究 问题 ,它们 各 具 优势 。 

考虑 一 列 来 自 于 低 维系 统 的 不 含 噪声 的 数据 , 当 它 岂 入 的 相 空 间 维 数 m 足够 
大 时 ,吸引 子 会 在 某 些 方向 上 具有 局 部 小 的 方差 ,此 时 数据 矩阵 X. 是 病态 的 。 例 
如 ,对 Henon 映射 产生 的 时 间 序 列 (天王 15,m 一 5),X 的 条 件数 01/05 可 以 达到 
OC10*) .这 是 由 于 系统 的 吸引 子 主要 集中 在 R" 的 子 空间 中 ,而 该 子 空间 外 部 的 微 
小 变化 可 能 包含 较为 有 用 的 信息 ,然而 正则 化 估计 会 将 这 样 一 些 信息 过 滤 掉 ,这 就 
导致 正则 化 所 作 的 预测 变 坏 。 只 要 数据 矩阵 的 条 件数 不 大 到 会 产生 数值 计算 方面 
的 问题 时 ,普通 最 小 二 乘 估 计 仍然 是 最 好 的 。 另 外 , 当 Km 时 ,OLS 估计 变 得 不 
稳定 ,这 时 正则 化 的 作用 非常 明显 。 


5.4.5 Lorenz 系统 的 仿真 模拟 


为 了 验证 多 变量 非 线 性 时 间 序 列 的 正则 化 局 部 线性 和 局 部 多 项 式 预 测 法 优 于 
一 般 的 局 部 线性 和 局 部 多 项 式 预测 法 ,下 面 采用 分 别 加 入 5% 和 10% 正 规 白 噪声 
的 Lorenz 系统 进行 仿真 检验 。 考 虑 以 下 Lorenz 系统 


E = 0 — n) 
dz = ar — 23) — 2 (5. 104) 
dz, 

it 


de = Tt bz 
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HOF o—10, 728,5 S, 15.34 155713: 68« 2:437. 91, 积 分 步 长 /一 
0. 04。 利 用 四 阶 Runge-Kutta 积分 法 计算 出 两 个 包含 10 000 个 数据 的 仿真 时 间 序 
列 x, 和 zzo Wt 5001 一 6000 之 间 的 N —1000 个 数据 参加 实验 ,得 到 多 变量 时 间 序 
FY (ris tan Oh. HH 4.3.4 T5256 IB RETE n — 04m, —2,m —2, HEMI 
回归 (PCR) 估 计 , 由 于 Lorenz 吸引 子 的 拓扑 维 d= 2. 06 RRR IEM LER q= 30 
上 岭 回 归 (RR) 估 计 , 取 y=0?。 


1. 基于 正则 化 的 局 部 线性 预测 


图 5. 4 表示 对 Lorenz 系统 的 两 变量 非 线性 时 间 序列 {Cziorzzn) Jier DM 5% OR 
声 后 ,利用 普通 最 小 二 乘 的 局 部 线性 预测 法 (OLS) 和 利用 正则 化 的 局 部 线性 预测 
法 (PCR，RR), 对 最 后 100 个 数据 进行 一 步 预测 得 到 的 正规 化 均 方 根 误差 
NRMSE, 


0.18 


— 


图 5.4 du 5 MUS Lorenz 系统 的 局 部 线性 预测 的 一 步 预测 误差 
图 5. 5 表示 对 Lorenz 系统 的 两 变量 非 线性 时 间 序 列 {(zuwyzze) nT HM 10% 
噪声 后 ,利用 普通 最 小 二 乘 的 局 部 线性 预测 法 (OLS) 和 利用 正则 化 的 局 部 线性 预 
测 法 (PCR，RR), 对 最 后 100 个 数据 进行 一 步 预 测 得 到 的 正规 化 均 方 根 误差 
NRMSE, 
表 5.5 给 出 了 Lorenz RAAI Pj 3 Hk 4E RE AT [8] JE P (ns Zen) tt ,利用 普 
通 最 小 二 乘 的 局 部 线性 预测 法 (OLS) 和 正则 化 的 局 部 线性 预测 法 (PCR，RR ) 在 
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不 同 噪声 级 别 及 最 近邻 点 数 K 下 对 最 后 100 个 数据 进行 一 步 预测 的 正规 化 均 方 
根 误差 NRMSE 的 比较 。 


032 


03 


NRMSE 
o 
R 
T 


表 5.5 EREN Lorenz KKH) MMB E HUN HY EM (03977 IRM NRMSE 


图 5.5 Jm 10% MEER Lorenz 系统 的 局 部 线性 预测 的 一 步 预测 误差 


JE K>m+1 [g=m+1 K<m 
3 名 | 10 | $ 8 Ld 6 5 | 4 3 
ors | 6.0680 | 0.0693 | 0.0852 | 0.0983 | 0.1613 | 1.4898 | — = 

5% | PCR 0. 0662 0. 0649 0. 0676 0. 0705 0.0723 0. 0844 0. 1471 0. 1132 
RR 0. 0646 0. 0647 0. 0699 0.0734 0. 0769 | oni aX a 
OLS | 0.1415 | 0.1503 0.1610 0.2397 0.3142 1. 9085 pe -— 

10% | PCR | 0.1298 | 0.1304 0. 1333 0. 1326 0. 1407 0. 1494 0. 2901 0. 2671 
FEN RR 0.1347 0. 1405 0.1414 0. 1488 | 0.1587 — = = 


由 图 5. 4, E 5. 5 和 表 5. 5 可 以 看 出 ,对 含 不 同 噪声 级 别 的 多 变量 非 线性 时 间 
序列 进行 局 部 线性 一 步 预 测 时 ,都 有 同样 的 结果 , 即 

D 4 K>m+1 时 ,所 有 的 正则 化 预测 法 都 优 于 普通 最 小 二 乘 预测 法 。 

2) 使 用 基于 普通 最 小 二 乘法 的 局 部 线性 化 方法 时 ,天 的 取 值 对 结果 影响 非常 
大 ,当天 取 较 大 的 值 时 ,精确 度 提高 了 ,但 随 着 m 接近 天 ,误差 增长 较 快 , 且 一 般 较 
小 的 天 值 所 计算 出 的 误差 较 大 ,特别 当 K 与 m 非常 接近 时 ( 见 K=m+1 情形 )， 
误差 急剧 上 升 。 当 Km 时 ,预测 失败 。 

3) 3 K 5j m 非常 接近 时 ,其 至 <m 时 ,正则 化 的 PCR 法 仍 有 较 好 的 预测 


效果 。 
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4) 当 增 加 噪声 的 级 别 后 ,基于 普通 最 小 二 乘 和 基于 正则 化 的 局 部 线性 预测 法 
的 预测 误差 都 有 所 增 大 ,但 是 基于 普通 最 小 二 乘 的 局 部 线性 预测 法 的 预测 误差 增 
加 的 幅度 最 大 。 


2. 基于 正则 化 的 局 部 多 项 式 预测 
利用 式 (5.19) 进 行 局 部 多 项 式 预 测 , 此 时 取 多 项 式 阶 数 ;二 2, 则 待定 系数 个 


: 
MW J= Chr 24+1=CH+Cl-241=11, H 5.6 表示 对 Lorenz 系统 的 两 变量 


AE ACE A TB) PER Cran Tzn) THM 5 中 噪声 后 ,利用 普通 最 小 二 乘 的 局 部 多 项 式 预 
测 法 (OLS) 和 利用 正则 化 的 局 部 多 项 式 预测 法 (PCR, RR), 对 最 后 100 个 数据 进 
行 一 步 预 测 得 到 的 正规 化 均 方 根 误差 NRMSE 。 


rM T T Tr 


06 


05 


04 


NRMSE 


03 p 


e2[ 


图 5.6 加 5% 噪 声 后 Lorenz 系统 的 局 部 多 项 式 预 测 的 一 步 预测 误差 


图 5.7 表示 对 Lorenz 系统 的 两 变量 非 线 性 时 间 序 列 {(zia,)) 吕 加 10% E 
声 后 ,利用 普通 最 小 二 乘 的 局 部 多 项 式 预测 法 (OLS) 和 利用 正则 化 的 局 部 多 项 式 
预测 法 (PCR，RR), 对 最 后 100 个 数据 进行 一 步 预 测 得 到 的 正规 化 均 方 根 误差 
NRMSE, 

表 5.6 给 出 了 Lorenz AE fH) Pie i 3E AEA EI (Gras Zen) Jai AE 
通 最 小 二 乘 的 局 部 多 项 式 预测 法 (OLS) 和 正则 化 的 局 部 多 项 式 预测 法 (PCR， 
RR) 在 不 同 噪声 级 别 及 最 近邻 点 数 K 下 对 最 后 100 个 数据 进行 一 步 预测 的 正规 
化 均 方 根 误差 NRMSE 的 比较 。 
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NRMSE 


图 5.7 加 10% 噪 声 后 Lorenz 系统 的 局 部 多 项 式 预 测 的 一 步 预测 误差 
5.6 SWRPA Lorenz 系统 的 局 部 多 项 式 预测 的 正规 化 均 方 根 误 林 NRMSE 


法 16 15 14 13 2 n 10 9 


OLS | 0.0946 | 0.1116 | 0.1257 | 0.2126 | 0.5960 | 7.403 | 1.1782 | 2.4834 


5% | PCR| 0.0644 | 0.0648 | 0.0655 | 0.0705 | 0.0655 | 0.0666 | 0.0673 | 0.0670 


RR | 0.0704 | 0.0712 | 0.0731 | 0.0734 | 0.0864 — Es * 


OLS| 0.1890 one) 0.2940 | 0.6395 | 0.9273 | 3.4985 | 4.9619 | 6.3496 


10% | PCR | 0.1250 | 0.1277 | 0.1279 | 0.1288 | 0.1293 | 0.1324 | 0.1353 | 0.1388 


. ] 0.1399 | 0. . 一 = 一 
RR | 0.1349 | 0.1377 1 1446 | 0.1682 


由 图 5. 6,18 5. 7 和 表 5. 6 可 以 看 出 ,对 含 不 同 噪声 的 级 别 的 多 变量 非 线 性 时 
间 序 列 进行 局 部 多 项 式 一 步 预测 时 ,与 局 部 线性 一 步 预测 有 类 似 的 结果 BD 

D 当天 >J 十 1 时 ,所 有 的 正则 化 预测 法 都 优 于 普通 最 小 二 乘 预 测 法 。 

2) 使 用 基于 普通 最 小 二 乘法 的 局 部 多 项 式 预测 方法 时 ,K 的 取 值 对 结果 影响 
非常 大 ,当天 取 较 大 的 值 时 ,精确 度 提 高 了 ,但 随 着 K 接近 于 待定 系数 个 数 Bt, 
误差 增长 较 快 , 且 一 般 较 小 的 KK 值 所 计算 出 的 误差 较 大 ,特别 当天 与 了 非常 接近 
ACR K=J 情形 ), 误 差 急 剧 上 升 ,预测 误差 大 于 1 ,因而 此 时 预测 效果 很 差 。 
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3) 当天 5j J 非常 接近 时 ,甚至 天 入 yJ 时 ,正则 化 的 PCR 法 仍 有 较 好 的 预测 
效果 。 

4) 当 增 加 噪声 的 级 别 后 ,基于 普通 最 小 二 乘法 和 基于 正则 化 法 的 局 部 多 项 式 
预测 方法 的 预测 误差 都 有 所 增 大 ,但 是 基于 普通 最 小 二 乘法 的 局 部 多 项 式 预 测 方 
法 的 预测 误差 增加 的 幅度 最 大 。 

由 上 面 的 分 析 表 明 , 当 K 取得 较 大 时 ,不 管 是 基于 普通 最 小 二 乘法 还 是 基于 
正则 化 方法 所 得 的 预测 误差 都 较 小 , 当 K 取得 较 小 时 ,基于 正则 化 方法 的 预测 误 
差 要 远 小 于 基于 普通 最 小 二 乘法 的 预测 误差 。 实 际 问题 中 由 于 样本 容量 有 限 ,天 
值 不 可 能 无 限 增 大 , 随 着 K 值 的 增加 计算 量 加 大 ,所 以 基于 正则 化 的 多 变量 局 部 
线性 化 法 或 局 部 多 项 式 法 预测 效果 比 一 般 的 局 部 线性 化 或 局 部 多 项 式 预测 法 好 ， 
基于 正则 化 的 局 部 线性 预测 法 或 局 部 多 项 式 预 测 法 抗 噪 性 比 一 般 的 局 部 线性 预测 
法 或 局 部 多 项 式 预测 法 强 ; 基 于 正则 化 的 局 部 线性 预测 方法 或 局 部 多 项 式 预测 方 
法 的 预测 范围 比 一 般 的 局 部 线性 化 或 局 部 多 项 式 预测 法 广 .因此 ,在 实际 问题 中 用 
基于 正则 化 的 局 部 线性 化 预测 方法 或 局 部 多 项 式 预 测 方法 更 有 应 用 价值 。 


5.5 基于 正则 化 的 多 变量 非 线 性 时 间 序 列 的 自 适应 预测 方法 


一 般 的 局 部 线性 化 预测 方法 是 取 固定 的 戏 入 维 数 m, MEARE K 及 正则 化 
参数 9 与 /。 按 照 F. Taken 的 乌 入 定理 , 宜 选 择 较 大 的 嵌入 维 数 .将 时 间 序 列 映射 
到 高 维 相 空间 中 ,尽管 有 利于 消除 噪声 等 因素 造成 的 虚假 邻 点 ,但 是 鉴于 样本 数量 
有 限 ,在 相 空间 中 某 些 点 处 可 能 找 不 到 足够 数目 的 邻近 点 ,这 是 导致 预测 误差 增加 
的 主要 原因 "5; 将 混沌 时 间 序 列 映射 到 较 低 维 相 空 间 中 ,尽管 可 能 存在 轨道 交叉 
和 虚假 邻 点 ,但 是 在 相 空 间 中 容易 找到 当前 点 的 足够 数目 的 邻近 点 。 因 此 ,对 不 同 
的 预测 点 ,应 选择 不 同 的 嵌入 维 数 ,以 达到 改善 预测 精度 的 目的 。 文 献 [163] 给 出 了 
一 种 基于 奇异 值 分 解 的 自 适应 局 部 线性 化 方法 , 它 可 以 自 适应 确定 当前 嵌入 维 数 ， 
从 而 克服 病态 数据 矩阵 的 影响 。 该 方法 与 一 般 的 局 部 线性 化 方法 的 最 大 不 同 之 处 
是 ,前 者 在 每 个 预测 时 刻 可 采用 不 同 的 嵌入 维 数 ,而 后 者 在 所 有 的 预测 时 刻 均 采 用 
相同 的 嵌入 维 数 。 然 而 ,文献 [163] 仅 对 最 小 二 乘法 进行 了 研究 , 且 对 邻近 点 数目 
K 取 的 是 固定 值 ,这 里 在 文献 [163] 的 基础 上 对 邻近 点 数目 天 及 正则 化 参数 9 与 
Aw 均 采用 自 适应 取 值 ,这 样 可 以 大 大 提高 基于 一 般 正 则 化 回归 所 作 的 局 部 线性 预 
测 的 精度 。 因 为 在 当前 时 刻 自 适应 地 选择 合适 的 嵌入 维 数 m BR K 及 正 
则 化 参数 q 与 w, 可 望 获得 比 这 些 参数 取 固 定 值 时 更 好 的 预测 结果 。 


5.5.1 基于 正则 化 的 自 适应 预测 的 步骤 
当 X 不 是 列 满 秩 或 的 条 件数 过 大 时 ,最 小 二 乘法 估计 出 的 参数 不 可 信 , 因 
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此 需要 改良 天 ,以 使 其 列 满 秩 且 条 件数 不 大 于 一 个 给 定 的 正 数 M, 从 而 保证 参数 
估计 的 稳健 性 。 在 当前 时 刻 点 ,如 果 足 够 大 的 嵌入 维 数 是 合理 的 ,那么 数据 抢 阵 天 
列 满 秩 且 其 条 件数 不 大 于 M; 反 之 ,下 很 可 能 是 病态 的 。 基 于 这 个 分 析 ,我 们 可 以 
在 不 损失 估计 精度 的 前 提 下 达到 此 目的 ,做 法 是 先 选 一 个 初始 嵌入 维 数 m, 然 后 在 
当前 时 刻 点 ,如 果 天 是 病态 的 ,就 做 降 维 处 理 , 从 而 找到 一 个 最 大 的 使 不 列 满 秩 且 
其 条 件数 不 大 于 M RABE mo, pepe etm TF: 

第 一 步 : 初 选 嵌 入 维 数 m EA E RFRA M>. 

第 二 步 :在 当前 时 刻 , 由 5. 1. 2 节 给 出 的 方法 自 适应 地 确定 邻近 点 数目 天 , 构 
Hi X EX X (A SVD 分解。 

第 三 步 : 若 m/o.<M, 则 取 mo 一 ~, 否则 转 第 四 步 。 

第 四 步 :r=r 一 1;0,=0,_1。 

第 五 步 ;重复 第 三 步 和 第 四 步 直 至 o,/o,<M. 

确定 了 合适 的 嵌入 维 数 me 后 ,就 可 以 重 构 相 空间 ,然后 用 正则 化 回归 方法 计 
算 在 当前 时 刻 点 的 预测 值 。 其 步骤 如 下 : 

58 —32b WIE HEC m ETE AR UPC M>., 

第 二 步 :由 5. 1. 2 节 给 出 的 方法 自 适应 地 确定 邻近 点 数目 天 。 

第 三 步 :在 当前 时 刻 , 调 用 上 面 的 算法 自 适 应 地 确定 合适 的 嵌入 维 数 mo。 

第 四 步 : 自 适应 地 确定 正则 化 参数 q 与 /。 

第 五 步 :如 果 mo m MARIE C5. 79) 3X C5. 92) 及 式 (5.100) 分 别 确定 c, 然 
后 根据 式 (5. 8) 做 出 预测 。 

第 六 步 :否则 ,根据 mo 重 构 相 空间 ,再 自 适应 地 确定 邻近 点 数目 ,并 用 式 
(5. 79) 及 式 (5. 92) X C5. 100) 做 出 预测 。 

第 七 步 :对 新 的 目标 点 ,重复 第 一 步 至 第 六 步 直到 结束 。 

上 述 算法 中 的 条 件数 阔 值 M 一 般 根据 实验 结果 合理 选择 。 根 据 经 验 , 对 许多 
实际 问题 ,一般 取 M=100 较 合 适 。 

为 了 对 自 适应 局 部 线性 化 法 有 一 个 初步 认识 ,首先 将 由 两 种 方法 计算 出 的 奇 
异 值 和 过 滤 因 子 进行 对 比 ,来 说 明 自 适应 局 部 线性 化 法 的 优势 。 以 Lorenz 系统 为 
例 ,图 5. 8~ [8 5. 11 IR ÉD E m —8,7—4, 2 —15 时 用 一 般 局 部 线性 化 方法 与 自 
适应 局 部 线性 化 方法 分 别 对 单个 值 进 行 一 步 预 测 时 奇异 值 伟 里 叶 系 数 、 残 差 标准 
差 和 过 滤 因子 的 结果 。 对 主 成 分 回归 PCR, 取 g 一 3, 对 冷 回 归 RR, 取 yx 一 9。 

由 图 5. 8 可 以 看 出 , 残 差 标 准 差 o 接近 于 零 , 并 且 最 后 四 个 o lur y | 接近 于 
零 , 由 此 可 知 最 小 二 乘 估计 变 坏 , 而 对 正则 化 估计 而 言 ,对 应 的 过 滤 因 子 必须 为 零 ， 
才能 消除 小 奇异 值 的 影响 。 在 图 5. 9 中 ,PCR 的 后 面 五 个 过 滤 因 子 全 为 零 , 所 以 取 
4=3 显得 过 于 保守 ,过 滤 掉 了 方向 u,, 减 少 了 可 以 利用 的 信息 ,进而 会 影响 估计 的 
准确 性 。 对 于 RR ,由 于 残 差 标准 差 太 小 ,致使 后 四 个 过 滤 因 子 全 不 为 零 ,RR 估计 
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奇异 值 


图 5.8 一 般 局 部 线性 化 方法 计算 的 奇异 值 伟 里 叶 系 数 及 残 差 标准 差 


- - - - — 


xttl 


图 5. 9 一 般 局 部 线性 化 方法 计算 的 过 滤 因 子 

没有 对 OLS 估计 进行 有 效 压 缩 。 因 此 ,由 一 般 局 部 线性 化 法 得 到 的 过 滤 因 子 没有 
起 到 应 有 的 作用 .在 相同 条 件 下 , 当 改 用 自 适 应 局 部 线性 化 法 时 ,结果 有 明显 改进 。 
通过 自 适 应 选取 嵌入 维 m, 得 到 该 点 较 合适 的 嵌入 维 数 是 6, 图 5. 10 中 ,由 自 适应 
局 部 线性 化 法 计算 的 残 差 标准 差 so 小 于 主要 的 奇异 值 o 及 信里 叶 系 数 的 大 
lut y | FF ELBUS TIAS o; c luy | BGECT AE E 5. 11 中 正则 化 估计 对 应 的 过 滤 因 子 
全 为 零 .通过 这 个 例子 检验 了 自 适应 确定 正则 化 参数 的 方法 是 合理 的 ,因此 可 以 预 
期 由 自 适应 局 部 线性 化 方法 能 够 得 到 更 好 的 预测 结果 。 
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图 5.11 自 适应 局 部 线性 化 方法 计算 的 过 滤 因 子 


5.5.2 Henon 映射 的 仿真 检验 


为 了 分 析 使 用 自 适应 局 部 线性 化 方法 以 后 最 小 二 乘 回 归 和 正则 化 回归 的 改进 
程度 ,下 面 将 最 小 二 乘 回 归 和 正则 化 回归 放 在 一 起 进行 对 比 研究 。Henon 映射 是 
一 个 具有 吸引 子 的 二 维 迭代 映射 ,其 方程 如 下 : 

dui 一 1 十 加 一 az 


Ynti = bz, 


(5. 105) 
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34 =1.40 和 0 一 0.30 时 ,获得 了 混沌 运动 。 取 初 值 (0. 1, 0. OTER, f C. 
的 1100 个 采样 点 ,并 给 它 附加 5% 的 正规 白 噪声 。 分 别 用 一 般 局 部 线性 化 方法 以 
及 自 适应 局 部 线性 化 方法 进行 一 步 预 测 , 前 1000 个 数据 用 作 拟 合 ,后 100 个 数据 
用 作 测 试 。 

1. 正则 化 参数 固定 的 情况 


下 面 用 Henon 映射 这 一 低 维 混沌 系统 来 说 明 自 适应 局 部 线性 化 法 (此 处 仅 自 
适应 确定 幅 入 维 数 ,正则 化 参数 仍 取 固定 值 ) 的 预测 能 力 强 于 一 般 局 部 线性 化 方 
法 ,并 研究 噪声 对 线性 模型 预测 效果 的 影响 。 图 5. 12 和 图 5. 13 分 别 给 出 了 无 噪声 
和 有 了 噪声 情况 下 正规 化 均 方 根 误差 NRMSE 对 不 同 的 m 值 的 变化 情况 ,其 中 r= 
3, 对 主 成 分 回归 PCR ,对 应 于 Henon 吸引 子 的 拓扑 维 d= 二 1.25, 取 正则 化 参数 
4 一 2; 对 岭 回归 RR, 取 y= 呈 , 相 应 的 正规 化 均 方 根 误差 NRMSE 值 见 表 5. 7。 


08 


NRMSE 
9 p 
— 


AME m 
图 5.12 K=15 时 无 噪声 Henon 映射 的 一 般 局 部 线性 化 法 预测 的 误差 
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NRMSE 


ASE m 
图 5.13 无 噪声 Henon 映射 的 自 适应 局 部 线性 化 法 预测 的 误差 
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表 5.7 无 噪声 Henon 映射 的 正规 化 均 方 根 误 亲 NRMSE 


方法 m-2 m=3 m=4 m=5 m=6 m=7 
OLS 0. 0921 0.1031 0.2970 0.3170 0.4203 0. 5286 
2n PCR 0.0921 9. 1451 0. 3072 0. 4846 0.5772 0. 7073 
RR 0.0927 0. 1031 0.2044 0. 2989 0.3746 0. 4499 
OLS 0.0411 0. 0142 0 0. 3227 0. 3944 0.5179 

Bi T 
Hu PCR 0.0411 0.0157 0 0. 4890 0. 6077 0. 7334 
RR 0. 0407 0.0143 0 0. 3059 0. 3641 0. 4700 

LLL 


比较 图 5. 12 与 图 5. 13 CHA 5. 7 中 ) 可 以 看 出 ,对 无 噪声 的 Henon BRAT , 采 
用 自 适 应 局 部 线性 化 方法 后 ,结果 明显 好 于 一 般 局 部 线性 化 方法 ,并 且 无 论 是 用 一 
般 局 部 线性 化 方法 还 是 用 自 适应 局 部 线性 化 方法 ,OLS 的 NRMSE 均 小 于 PCR 
的 NRMSE, 这 是 由 于 正则 化 过 滤 掉 了 有 用 的 预测 信息 。 值 得 注意 的 是 ,对 较 大 的 
zw 值 ,由 自 适应 局 部 线性 化 法 计算 PCR 的 NRMSE, 其 增长 有 加 快 的 趋势 ,这 是 由 
于 在 每 个 目标 点 处 ,经 过 自 适应 选择 m 后 ,数据 矩阵 X 的 奇异 性 已 大 大 降低 了 ,对 
PCR ,如 果 再 取 较 小 的 9 值 (此 处 q— 2) ,就 会 过 滤 掉 较 多 有 用 的 预测 信息 ,从 而 导 
致 NRMSE 增加 ,并 且 m 越 大 ,过 滤 掉 的 有 用 信息 越 多 ,NRMSE 增加 得 就 越 快 。 
对 RR, 有 两 个 值 变 大 了 ,也 有 改进 的 必要 ,后 面 将 结合 对 含 噪声 Henon 映射 的 分 
析 , 研 究 如 何 进一步 减少 它们 的 NRMSE。 由 图 5. 13 XE ST EUR Hi m —4 时 获得 最 
好 的 预测 结果 ,这 与 文献 [3] 给 出 的 标准 mz 24-1 一 致 。 

对 有 噪声 的 数据 ,使 用 一 般 局 部 线性 化 方法 预测 时 ,OLS 解 随 着 m 的 增加 变 
得 更 不 稳定 ,并 且 预 测 能 力 退 化 了 ,特别 当 m 接近 天 时 ,误差 变 得 非常 大 (图 
5. 14, Hl 5. 15 及 表 5. 8)。 此 时 RR 预测 也 失效 了 ,这 是 由 于 低估 了 残 差 方 差 ,因此 
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图 5.14 K=8 BLA MRA Henon 映射 的 一 般 局 部 线性 化 法 预测 的 误差 
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RR 方法 中 被 噪声 干扰 较 多 的 方向 没有 进行 充分 压缩 。 从 表 5. 8 中 还 可 以 看 出 ， 


PCR 预测 较 稳定 。 使 用 自 适应 局 部 线性 化 法 后 ,OLS 及 RR 的 预测 效果 得 到 大 大 
改善 ,特别 当 m 接近 KK 时 ,改善 的 效果 非常 明显 ,而 PCR 基于 同样 的 原因 大 体 保 


持 不 变 , 且 略 有 退化 。 值 得 注意 的 是 ,使 用 自 适 应 局 部 线性 化 法 后 
正则 化 相同 的 预测 效果 。 


,OLS 达到 了 与 
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图 5.15 有 噪声 Henon 映射 的 自 适应 局 部 线性 化 法 预测 的 误差 
表 5.8 ARE Henon 映射 的 正规 化 均 方 根 误 楚 NRMSE 


方法 m-2 m=3 m=4 m=5 m=6 m=7 

OLS 0. 1659 0. 1629 0. 2538 0.4272 0. 8933 6. 4802 

kis PCR 0. 1659 0. 1681 0. 2589 0.4059 0. 5499 0. 6423 
方法 

RR 0.1577 0.1517 0. 2270 0. 3062 0.6212 6. 4802 

OLS 0. 1597 0. 1806 0.2534 0.3275 0.4049 0. 5302 
Aid 

` PCR 0. 1597 0. 1821 0. 3267 0.5100 0. 6027 0. 7339 
应 法 

RR 0. 1507 0. 1704 0.2432 9.3115 0. 3799 0. 4889. 

— —— — — — — ee 


2. 正则 化 参数 自 适 应 选取 的 情况 


在 表 5.7 及 表 5. 8 中 ,使 用 自 适应 局 部 线性 化 法 后 PCR 及 RR 的 NRMSE 还 
没有 达到 非常 满意 的 结果 ,这 是 由 于 正则 化 参数 取 的 是 固定 值 。 为 了 进一步 降低 


PCR 及 RR 的 误差 ,对 不 同 的 目标 点 ,正则 化 参数 g 与 应 该 取 不 


辣 的 值 。 首先 讨 


论 参 数 g 如 何 自 适应 取 值 ,经 自 适应 选取 m 后 ,数据 矩阵 X 的 奇异 性 大 大 降低 了 。 
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换 句 话说 ,X 没有 非常 小 的 奇异 值 ,所 以 9 不 应 该 取 较 小 的 值 ,考虑 让 它 与 矩阵 天 
的 条 件数 7 联系 起 来 .文献 [164] 从 实际 应 用 角度 给 出 了 根据 条 件数 7 判断 矩阵 导 
的 列 向 量 间 多 重 共 线性 程度 的 标准 : 当 7<10 时 ,认为 多 重 共 线 性 的 程度 很 小 , 当 
10«x«100 时 , 则 认为 存在 中 等 程度 或 较 强 的 多 重 共 线 性 , 当 7>>100 时 , 则 认为 
存在 严重 的 多 重 共 线性 。 另外 , 当 和 矩阵 下 不 存在 多 重 共 线 关 系 时 ,OLS 估计 是 最 好 


的 , 即 不 应 该 在 估计 式 bos= D) My, 中 截 掉 后 面 一 些 项 。 也 就 是 说 ,此 时 应 取 
qr. 根据 这 一 想法 ,在 X 的 奇异 值 eO 中 寻找 满足 mi/a<<10G1 一 1， 
2，,…,7) 且 下 标 最 大 的 数 作为 g 的 值 (这 样 的 g 值 一 定 存在 ,因为 必 有 0/0, =1<10), 
下 面 再 来 讨论 参数 的 选取 .X 的 列 向 量 间 的 多 重 共 线性 程度 越 高 (此 时 条 件 
数 7 越 大 ), 就 要 求 采用 越 强 的 正则 化 ,也 就 是 要 对 OLS 估计 进行 更 多 的 压缩 。 在 
实际 问题 中 ,往往 由 于 残 差 的 方差 非常 小 , 即 y= 接近 于 零 ,导致 RR 并 没有 对 
OLS 估计 进行 充分 的 压缩 ,致使 RR 估计 变 得 不 理想 ,如 图 5. 15 所 示 。 为 了 改变 
这 种 情况 ,考虑 用 
nom Yo (5. 106) 
取代 y=, 此 时 RR 估计 的 过 滤 因 子 为 


(5. 107) 


当 多 重 共 线 性 程度 越 高 时 ,条 件数 y 越 大 ,过 滤 因 子 就 越 小 ,此 时 对 OLS 估 
计 的 压缩 就 越 多 。 

以 上 给 出 了 正则 化 参数 q 与 y 的 自 适 应 取 值 方法 ,为 了 检验 其 合理 性 ,对 图 
5.13 及 图 5. 15 中 所 用 的 数据 采用 所 给 方法 再 计算 一 遍 , 结 果 分 别 如 图 5. 16 和 
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图 5.16 无 噪声 Henon 映射 自 适应 选取 参数 g 与 上 后 
再 自 适 应 局 部 线性 化 法 预测 的 误差 


FRR 多 变量 非 线性 时 间 序 列 预 测 方法 *137* 


5. 17 及 表 5. 9 MR 5.10 所 示 。 


NRMSE 


RABE m 


图 5.17 MRF Henon 映射 自 适应 选取 参数 9 与 w 后 
再 自 适应 局 部 线性 化 法 预测 的 误差 


为 了 方便 与 表 5. 7 中 用 取 固定 的 g 与 “ 值 所 得 到 的 结果 对 比 ,把 两 次 计算 出 
的 NRMSE 放 入 表 5.9 中 。 


359. 自 适应 取 9 Sy MEERE Henon 映射 的 正规 化 均 方 根 误 林 NRMSE 


qth 方法 | m=2 m=3 m=4 m=5 m=6 m=7 

T pe 十 

取 OLS 0. 0411 0.0142 0 0. 3227 9. 3944 0.5179 

d rol] , | 

PCR 0.0411 0. 0157 0 0. 4890 0. 6077 0. 7334 

" RR 0. 0407 0. 0143 0 0. 3059 0. 3641 0. 4700 

= L 

a OLS 0.0411 0.0142 0 0.3227 0. 3944 0.5179 

应 PCR 0.0411 0.0142 0 0. 3264 0. 3918 0.5132 

取 i 

值 RR 0. 0406 0.0142 0 0. 2874 0. 3417 0. 4488 


%5.10 BAER g 5u hl SAR Henon 映射 的 正规 化 均 方 根 误 妆 NRMSE 


LEE 方法 m-2 m=3 m=4 m-5 — | maT 
E OLS 0.1597 0.1806 0. 2534 0.3275 | 0. 4049 0. 5302 
PCR 0.1597 0. 1821 0. 3267 0. 5100 0. 6027 0. 7339 
值 RR 0. 1507 0.1704 0.2432 9.3115 0. 3799 0. 4889 
B OLS 0.1597 [ 0. 1806 0. 2534 0. 3275 0. 4049 0. 5302 
[1 PCR 0. 1591 0. 1796 0. 2487 0. 3196 0. 4091 0.5185 
ki RR 0. 1541 0.1709 0. 2360 | 0. 3040 0. 3636 0. 4780 
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在 表 5.9 中 ,由 于 自 适应 选取 参数 g 与 y 对 OLS 没有 影响 , 故 OLS 的 
NRMSE 是 相同 的 。 对 于 PCR 与 RR, 自 适应 选取 正则 化 参数 gq 与 y 以 后 ,它们 的 
NRMSE 显著 降低 了 .说 明 该 方法 对 无 噪声 数据 的 效果 非常 好 。 再 来 看 该 方法 对 有 
噪声 的 数据 是 否 有 效 ,结果 如 表 5. 10 所 示 。 

自 适应 选取 正则 化 参数 g 与 y 以 后 ,PCR 的 NRMSE 明显 降低 了 ,而 对 于 
RR ,多数 NRMSE 值 减 小 了 , 少 部 分 值 却 变 大 了 ,但 减 小 的 幅度 较 明显 而 增 大 的 幅 
度 不 明显 。 经 过 数值 模拟 ,说 明 所 给 出 的 自 适应 选取 正则 化 参数 9 与 的 方法 是 有 
效 的 。 - 
由 表 5.7 及 表 5. 8 可 以 看 出 , 自 适应 局 部 线性 化 法 比 一 般 局 部 线性 化 法 给 出 
了 更 好 的 预测 结果 ,特别 是 当 对 PCR 的 参数 g 及 RR 的 参数 y 采用 自 适应 法 选择 
后 ,情况 更 是 如 此 ( 表 5.9 及 表 5.10)。 当 m 接近 K 时 ,一 般 局 部 线性 化 方法 的 误 
差 会 非常 大 (图 5. 14), 而 自 适 应 局 部 线性 化 法 则 表现 出 良好 的 稳健 性 ,其 结果 明 
显 优 于 一 般 局 部 线性 化 方法 , 它 克服 了 因 参 数 K 的 选择 不 当 而 造成 的 影响 。 当 观 
测 数据 中 加 入 测量 噪声 时 ,所 有 方法 的 预测 能 力 都 下 降 了 ,但 自 适应 局 部 线性 化 法 
比 一 般 局 部 线性 化 方法 具有 更 强 的 抗 噪 性 。 由 于 实测 数据 中 总 是 含有 噪声 的 ,所 以 
自 适应 局 部 线性 化 法 在 实际 问题 中 具有 明显 的 优势 。 
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在 证 券 市 场 中 的 应 用 


证 券 市 场 是 国家 经 济 运行 的 核心 ,探求 证 券 市 场 的 变化 规律 .进行 有 效 的 金融 
管理 ,提高 金融 投资 效率 是 各 国政 府 与 投资 机 构 追求 的 目标 ,对 证 券 市 场 的 各 种 时 
间 序 列 进行 分 析 、 预 测 和 控制 是 整个 证 券 市 场 活动 的 重要 工作 .我 国 证 券 市 场 经 过 
20 几 年 的 高 速 发 展 ,已 经 形成 了 相当 规模 的 市 场 ,证 券 市 场 是 一 个 受 多 种 因素 影 
响 的 庞大 的 系统 ,具有 非常 复杂 的 运动 规律 。 取 自 相同 时 间 段 的 多 种 证 券 时 间 序 
列 , 构 成 多 变量 证 券 时 间 序 列 。 这 些 证 券 时 间 序 列 则 是 证 券 市 场 的 外 在 表现 形式 。 
“本 质 决定 现象 ,现象 反映 本 质 ”, 因 此 证 券 时 间 序 列 中 必定 蕴含 了 市 场 复杂 系 统 许 
多 客观 规律 信息 .从 中 寻找 出 各 种 信息 ,更 好 地 认识 ,掌握 、 并 利用 其 规律 无 疑 对 证 
券 市 场 的 预测 ,决策 与 风险 管理 活动 具有 特别 重要 的 意义 。 


6.1 基于 单 变量 时 间 序列 的 证 券 市 场 
非 线性 性 和 确定 性 检验 


长 期 以 来 ,资本 市 场 理论 为 线性 范式 所 主宰 , 即 有 效 市 场 假设 , 它 假定 投资 者 
是 理性 的 ,有 秩序 的 ,有 条 理 的 , 它 把 数学 约 化 到 简单 的 线性 微分 方程 有 关 的 投资 
行为 模型 ,认为 证 券 市 场 是 一 个 随机 游 走 过 程 ,价格 变化 函数 的 概率 分 布 服 从 正 态 
分 布 。 然 而 ,证 券 市 场 却 不 是 秩序 的 或 简单 的 ,它们 既 混 乱 又 复杂 。E. 彼得 斯 在 他 
的 《资本 市 场 的 混沌 和 秩序 》 和 《分 形 市 场 分 形 一 一 将 混沌 理论 应 用 到 投资 与 经 济 
理论 上 ) 等 书 中 提出 了 一 种 资本 市 场 的 新 范式 ,在 资本 市 场 中 引入 了 混沌 理 
yos, EAE. 彼得 斯 说 的 那样 要 证 明 资本 市 场 是 “混沌 的 ”说 法 几乎 已 经 (并 
将 继续 ) 成 为 笑话 ,但 混沌 现象 必然 发 生 在 非 线 性 系统 内 ,因此 研究 证 券 市 场 的 非 
线性 性 和 确定 性 是 一 件 有 意义 且 非 常 重要 的 事情 。 


611 样本 数据 及 平稳 化 处 理 


选择 以 下 单 变量 证 券 市 场 指数 时 间 序 列 作为 研究 对 象 :上 海 证 券 市 场 综合 指 
数 ( 上 证 , 1997. 1, 2 ~ 2002. 12.27 数据 )、 香 港 恒生 指数 ( 恒 指 , 1997.1.2 一 
2002.12. 27 数据 )、 台 湾 加 权 指数 (台湾 ,1997. 1. 2 一 2002. 12. 27 数据 )、 美 国标 准 
普尔 500 指数 (普尔 ,1997. 1. 2 一 2002. 12. 27 数据 )。 表 6. 1 是 四 组 证 券 市 场 指数 C 
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时 间 序 列 的 统计 分 析 结 果 。 
表 6.1 各 证 券 市 场 指数 时 间 序 列 的 统计 数据 

统计 项 上 证 指数 恒生 指数 | 台湾 加 权 指数 普尔 500 指数 

均值 1536 12 468 | 6871. 96 778. 68 

标准 差 336. 74 2597. 75 1650. 94 378.51 
偏 度 0. 3444 0. 1516 —0. 0287 0. 4217 
峰 度 一 0.9785 一 0.8671 —1.0416 —1.3191 

Jarque Bera 84. 8333 51 59.72 323. 83 
非 线 性 时 间 序 列 的 很 多 处 理 方法 要 求 时 间 序 列 是 平稳 的 ,但 证 券 市 场 指数 时 


间 序 列 不 能 满足 平稳 性 的 要 求 ,为 此 ,在 进行 进一步 分 析 之 前 首先 需要 对 这 些 时 间 
序列 进行 平稳 处 理 . 为 了 保证 处 理 后 的 时 间 序 列 具有 实际 意义 ,通常 采用 差分 和 去 
除 趋势 的 方法 进行 平稳 处 理 2s~:9。 目 前 ,在 证 券 时 间 序 列 分 析 中 广泛 使 用 的 方法 
有 以 下 两 种 : 

1) 收益 率 (rate of return, ROR) 平 稳 化 方法 . 设 {P,} 为 指数 序列 , 则 收益 率 平 
稳 化 后 的 时 间 序 列 为 

z, = InP, — InP,., (6.1) 

2) 对 数 线性 去 趋势 (log-linear de-trending, LLD) 平 稳 化 方法 。 以 InP, AA 

变量 ,n 为 自 变量 ,做 以 下 对 数 线性 回归 


InP, = a 十 加 (6.2) 
得 对 数 线性 去 趋势 平稳 化 后 的 时 间 序列 为 
zr, = InP, — (a + bn) (6. 3) 


收益 率 平稳 化 方法 处 理 后 时 间 序 列 的 统计 数据 如 表 6. 2 所 示 , 对 数 线性 去 趋 
势 平 稳 化 方法 处 理 后 时 间 序列 的 统计 数据 如 表 6. 3 所 示 。 


RG. 2 各 证 券 市 场 指数 时 间 序列 经 收益 率 平稳 化 后 的 统计 数据 


pu - s ' 
统计 项 上 证 指数 恒生 指数 台湾 加 权 标准 普尔 500 
均值 0 一 0. 0001 0 —0. 0139 
Lu 0.1507 0.2132 0. 1653 0. 181 
LI 0. 0757 —0.2353 0. 2365 —0.0925 
峰 度 —1. 0084 —0. 6272 0.0311 0. 1567 
Jarque Bera 61.6092 |  — 37.2768 12.3254 | 7. 9804 
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表 6.3 各 证 券 市 场 指数 时 间 序列 经 对 数 线性 去 趋势 平稳 化 后 的 统计 数据 
统计 项 上 证 指数 恒生 指数 台湾 加 权 标准 普尔 500 


均值 0. 0004 0 一 0. 0003 0. 0004 


标准 差 0.0164 0.0208 0.0191 0.0105 


偏 度 0.0519 0.513 0.075 —0.0307 


峰 度 6. 086 8.9405 1. 7945 3. 7578 


Jarque Bera 2193.7 4909. 8 169. 063 1918.1 


图 6. 1 是 上 海 证 券 市 场 综 合 指数 时 间 序 列 通过 收益 率 (ROR ) 平 稳 化 和 对 数 
线性 去 趋势 (LLD) 平 稳 化 后 的 时 间 历 程 图 ,从 图 6. 1 中 可 以 发 现 ,平稳 化 后 的 时 间 
序列 中 ,对 数 线性 去 趋势 平稳 化 方法 产生 的 时 间 序列 的 平稳 性 要 比 收 益 率 平稳 化 
方法 产生 的 时 间 序 列 的 平稳 性 差 , 前 者 的 标准 差 是 后 者 的 9. 19 fif. 
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0 500 1000 1500 

图 6.1 上 证 综合 指数 两 种 不 同方 法 平稳 化 后 的 时 间 历 程 图 

图 6. 2 是 上 海 证 券 市 场 综合 指数 时 间 序 列 通过 收益 率 平稳 化 后 的 时 间 序 列 的 

直方 图 。 通 过 图 6. 2 很 容易 发 现 , 上 海 证 券 市 场 综合 指数 的 分 布 具 有 “尖峰 胖 尾 ” 的 

特点 ,不 符合 传统 的 有 效 市 场 假设 ,香港 恒生 指数 台湾 加 权 指 数 和 美国 标准 普尔 
500 指数 的 情况 类 似 。 


6.1.2 证 券 市 场 的 非 线性 性 检验 


采用 2. 5 节 的 替代 数据 法 对 上 述 平稳 化 后 的 时 间 序 列 进行 非 线 性 检验 ,其 中 
零 假设 为 原 时 间 序 列 来 自 具 常 系数 的 高 斯 线性 随机 过 程 经 过 单调 静态 非 线性 变 
换 ,利用 AAFT 算法 生产 替代 时 间 序 列 ,检验 结果 如 表 6. 4 所 示 。 
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0.835 766 —0471476 . — -0107186 0257 104 0.621394 0.985 684 
-0.653 621 0289 331 0,074 959 0.439 249 0.803 539 


标准 差 


图 6.2 上 证 综合 指数 通过 收益 率 平稳 化 后 的 直方 图 
Roa 各 证 券 市 场 指数 序列 非 线 性 性 的 检验 结果 


收益 率 时 间 序列 的 替代 法 检验 
mm 上 证 指数 | menn | enma 标准 普尔 500 
最 大 Lyapunov 指数 J J J 7 
关联 维 数 J dc ce e J 
-- 步 预测 误差 v 4 v ~ 
对 数 线性 去 趋势 时 间 序列 的 短 代 法 检验 
HNISGEM 上 证 指数 | 恒生 指数 ”| 。 台湾 加 权 标准 普尔 500 
最 大 Lyapunov 指数 x ~ VJ x 
mm 7 x x J 
一 步 预 测 误差 v x x E, 


iE: 表示 能 有 效 拒绝 零 假设 ,X 表示 不 能 有 效 拒绝 零 假设 。 


从 表 6.4 中 可 以 看 出 ,上 海 证 券 市 场 综合 指数 .香港 恒生 指数 ,台湾 加 权 指数 
和 美国 标准 普尔 500 指数 时 间 序 列 经 对 数 线性 去 趋势 平稳 化 后 的 时 间 序 列 , 在 采 
用 最 大 Lyapunov 指数 ,关联 维 数 和 一 步 预测 误差 作为 判别 统计 量 时 ,未 能 很 好 地 
拒绝 零 假 设 ; 当 原 指数 时 间 序 列 经 收益 率 平稳 化 后 的 时 间 序 列 ,在 采用 最 大 Lya- 
punov 指数 .关联 维 数 和 一 步 预 测 误差 作为 判别 统计 量 时 ,能 有 效 地 拒绝 零 假 设 。 
进一步 利用 R/S 分 析 法 和 BDS 检验 方法 可 以 判断 出 上 述 四 个 证 券 市 场 均 具有 一 
定 程度 的 非 线 性 ,详细 内 容 可 见 文献 [169,170]。 
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6.1.3 证 券 市 场 的 确定 性 检验 


使 用 递归 图 可 以 通过 视觉 直接 审视 被 检测 时 间 序 列 是 随机 无 序 结构 的 还 是 有 
可 识别 模式 的 ,如 果 可 以 寻找 出 特定 的 模式 则 可 以 进一步 假设 该 时 间 序列 具有 一 
定 的 确定 性 ,该 时 间 序列 中 的 确定 性 可 以 通过 某 些 特征 值 .递归 图 中 点 的 分 布 规律 
等 进一步 检测 获得 ,如 果 该 时 间 序 列 是 随机 的 , 则 它 递归 图 中 的 点 应 均匀 分 布 在 整 
个 图 形 中 ,从 中 无 法 识别 出 固定 的 模式 。 如 果 时 间 序 列 中 具有 确定 性 , 则 递归 图 中 
点 的 分 布 具 有 规律 性 。 例 如 ,在 对 角 线 周围 有 平行 与 对 角 线 的 线段 , 则 表明 该 时 间 
序列 具有 一 定 的 预测 能 力 。 通 常 递归 图 主要 用 于 对 时 间 序 列 进行 定性 分 析 。 

图 6.3 和 图 6. 4 分 别 是 6. 1. 1 节 中 的 上 海 综合 指数 经 收益 率 平稳 化 和 经 对 数 
线性 去 趋势 平稳 化 后 的 时 间 序 列 的 递归 图 ,两 个 图 中 均 可 以 在 对 角 线 周围 发 现 明 
显 的 平行 线段 。6.1. 1 节 中 的 其 他 三 组 证 券 时 间 序列 经 平稳 化 后 均 可 以 发 现 类 似 
现象 。 据 此 可 以 认为 上 海 证 券 市 场 综 合 指数 .香港 恒生 指数 .台湾 加 权 指数 和 美国 
标准 普尔 500 指数 时 间 序 列 经 平稳 化 后 具有 较 明 显 的 确定 性 。 
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图 6.3 上 证 指数 经 收益 率 平稳 化 后 的 递归 图 


图 6.3 和 图 6. 4 所 示 的 递归 图 中 间 有 很 多 复杂 的 结构 通过 视觉 很 难 被 辨识 ， 
为 此 进一步 引入 与 递归 图 紧密 相关 的 特征 基 , 比 较 常用 的 特征 基 有 以 下 两 个 : 
CD 递归 点 比例 (REC) 
递归 点 比例 (REC) 的 计算 公式 为 
REC = x (6.4) 
式 中 , N, 是 所 有 递归 点 (递归 图 中 的 黑 点 );N, 是 所 有 可 能 的 递归 点 的 个 数 。 
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图 6.4 上 证 指数 经 对 数 线性 去 趋势 平稳 化 后 的 递归 图 
(2) 确定 性 比例 (DET) 
确定 性 比例 (DET) 的 计算 公式 为 
N, 


DET — N, (6.5) 


RPF, N 是 包含 在 与 对 角 线 平行 线段 中 的 递归 点 个 数 。 

表 6.5 和 表 6. 6 分 别 给 出 了 6. 1. 1 节 中 所 研究 的 四 个 证 券 时 间 序列 经 收益 率 
平稳 化 和 经 对 数 线性 去 趋势 平稳 化 处 理 后 时 间 序 列 递归 图 的 REC 和 DET, 为 了 
便于 对 比 , 表 中 同时 提供 了 该 时 间 序 列 经 随机 变换 方式 和 AAFT 方法 产生 的 替代 
时 间 序 列 对 应 的 REC 和 DET。 

从 表 6. 5 和 表 6. 6 中 可 以 看 出 ,对 于 REC 和 DET 而 言 , 经 随机 方法 和 AAFT 
方法 生成 的 替代 时 间 序 列 比 经 收益 率 平稳 化 和 经 对 数 线性 去 趋势 平稳 化 处 理 后 的 
时 间 序 列 的 值 明显 下 降 。 根 据 REC fil DET 的 定义 ,表明 上 述 四 个 证 券 时 间 序列 对 
应 的 复杂 系统 具有 较 明 显 的 确定 性 。 


Xs 原始 和 备 代 时 间 序 列 的 REC 计算 结果 对 比 


收益 率 平稳 化 后 的 REC 对 数 线性 去 趋势 平稳 化 后 的 REC 
原始 随机 aart | 原始 随机 AAFT 


上 证 0. 036 0.001 0.003 0.114 0. 001 0. 002 
Jk 0.191 0.021 0.032 0.162 0. 001 0. 124 
台湾 0.012 0.001 0.011 0.257 0. 001 0.191 
普尔 0. 028. 0. 003. 0. 004. 0. 141 0. 001 0. 231 
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6.6 原始 和 替代 时 间 序 列 的 DET 计算 结果 对 比 
收益 率 平稳 化 后 的 DET 对 数 线性 去 趋势 平稳 化 后 的 DET 


项 目 


原始 随机 AAFT 原始 随机 AAFT 


上 证 0. 461 0.001 0.001 0.612 0.001 0. 001 
LE] 0.511 0. 001 0.001 0.823 0. 001 0. 701 


台湾 0.012 0.011 0.011 0. 905 0. 001 0. 801 


普尔 0.521 0. 001 0.001 0.711 0. 001 0. 691 


6.2 基于 多 变量 时 间 序 列 的 证 券 市 场 非 线 性 性 检验 


证 券 市 场 中 常常 可 以 获得 同时 测量 的 多 组 时 间 序 列 构成 多 变量 时 间 序 列 。 例 
如 ,证 券 市 场 的 分 类 指数 时 间 序 列 、 分 类 成 交 量 时 间 序 列 等 。 本 节 将 利用 第 三 章 的 
基于 多 变量 时 间 序 列 的 系统 非 线 性 性 检验 方法 分 析 证 券 市 场 的 非 线 性 特征 。 


6.2.1 样本 数据 及 平稳 化 处 理 


选取 上 海 证 券 市 场 分 类 指数 的 每 日 收盘 指数 作为 研究 对 象 ,具体 样本 为 1997 
年 1 月 2 日 到 2002 年 4 月 30 日 的 工业 类 {Pi.,)、 商 业 类 {Pi.,)、 地 产 类 {P,,,} 和 公 
用 事业 类 {P,.,)} 指 数 ,构成 四 个 变量 的 时 间 序 列 {Pi,,}/ 二 1,2,3,4, 其 时 间 历 程 图 如 
图 6.5 所 示 。 

由 于 证 券 市 场 指数 时 间 序列 有 随 经 济 增长 的 趋势 ,因此 必须 先 去 除 这 种 趋势 ， 
使 时 间 序 列 平稳 化 。 类 似 于 单 变量 的 情况 ,用 以 下 两 种 去 趋势 方法 处 理 。 

COD 收益 率 平稳 化 方法 

VP ,= 1524354 为 指数 序列 , 则 收益 率 平稳 化 后 的 序列 为 

Zin 一 lnP — InP, l= 1525354 (6. 6) 
则 由 工业 类 {Pi.,)、 商 业 类 {P,.,}、 地 产 类 {P;.,} 和 公用 事业 类 {P,.,} 指 数 构成 的 四 
变量 时 间 序 列 通过 收益 率 平稳 化 后 的 时 间 序 列 历程 图 如 图 6. 6 所 示 。 

(2) 对 数 线性 去 趋势 平稳 化 方法 

以 lnP,. 为 因 变量 ,” 为 自 变量 ,做 以 下 对 数 线性 回归 


lnP = a, + bm (6.7) 
得 对 数 线性 去 趋势 平稳 化 后 的 序列 为 
Zi, = InP, — (a, + bn), l= 1,2,3,4 (6.8) 


则 由 工业 类 {Pi.,}、 商 业 类 {P;.,)、 地 产 类 {P;.,} 和 公用 事业 类 {P,.,} 指 数 构成 的 四 
变量 时 间 序 列 通过 对 数 线性 去 趋势 平稳 化 后 的 时 间 序 列 历程 图 如 图 6. 7 所 示 。 
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图 6.5 上 海 证 券 市 场 的 分 类 指数 序列 时 间 历 程 图 
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图 6.6 收益 率 平稳 化 后 的 分 类 指数 序列 时 间 历 程 图 


第 六 章 “” 非 线性 时 间 序列 分 析 法 在 证 券 市 场 中 的 应 用 147° 


-0.5 - — ri " 
0 200 400 600 800 1000 1200 
n 
os - - - 
HD ~ 
E 
-05 + 1 — n 
0 200 400 600 800 1000 1200 


e. 
| 


os | —— + J E 
is [ww Py T 
-05 " n 1 " 1 
0 200 400 600 800 1000 1200 


图 6.7 对 数 线性 去 趋势 平稳 化 后 的 分 类 指数 序列 时 间 历 程 图 


对 上 述 去 趋势 后 的 时 间 序 列 中 的 每 个 变量 时 间 序 列 标准 化 , 即 得 到 各 变量 均 
值 为 零 ,方差 为 1 的 多 变量 时 间 序列 。 


6.2.2 证券 市 场 的 非 线 性 性 检验 


零 假 设 1: 时 间 序 列 来 自 具 常 系数 的 高 斯 线性 随机 过 程 。 

利用 2.5. 1 节 中 随机 相位 化 Fourier 变换 (FT) 方 法 产生 19 组 替代 多 变量 时 
间 序 列 , 对 经 过 收益 率 平稳 化 后 的 时 间 序 列 , 当 r= 0. 3 时 ,经 计算 ,线性 元 余 的 显 
著 性 检验 统计 量 DIFFL Cans Tentei Tsini Lan) K F B ſa ER ERA c 的 函数 如 图 
6. 8(a) 所 示 , 广 义 元 余 显著 性 检验 统计 量 DIFFR,(zi.o;zzw+rizanizto) 关 于 时 间 
延迟 间隔 = 的 函数 如 图 6. 8(b) (4 — 1). EH 6. 8(c)(g==2) 和 图 6. 8(d)(g 二 3) 所 示 。 

线性 边缘 元 余 ACen Zentes Esmi Lan) GT” (ins riaeci Fant 
zim) 的 显著 性 检验 统计 量 DIFFA C21 s Tz.nt+r3 Esni Lan) FM DIFF Pg (21 05 Lonte3 Tani 
ztm) 的 计算 结果 如 图 6.9 所 示 。 

对 经 过 对 数 线性 去 趋势 平稳 化 后 的 时 间 序 列 , 当 ~ 一 0. 1 时 ,经 计算 ,线性 元 余 
的 显著 性 检验 统计 量 DIFFZ(ziizzs+rizasizts) 关 于 时 间 延 迟 间 隔 c 的 函数 如 
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图 6.9 收益 率 分 类 指数 序列 在 零 假设 1 下 的 显著 性 检验 统计 量 
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图 6. 10(a) 所 示 ,广义 元 余 显著 性 检验 统计 量 DIFFR, (21.05 Lente5 Esni Lind AT ATLA 
延迟 间隔 r 的 函数 如 图 6. 10(b)(q=1), R 6. 10(c)(9 一 2) 和 图 6. 10(d)(9 一 3) 所 示 。 
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图 6.10 对 数 线性 去 趋势 后 的 分 类 指数 序列 在 零 假 设 1 下 的 显著 性 检验 统计 量 

线性 边缘 元 余 1Czuwszzn+rizawizto) 与 广义 边缘 宛 余 Oy (Lins Lente Lint 
ztm) 的 显著 性 检验 统计 量 DIFFA Cini Lentet Esni Lan) M DIFFAP(Czioyzan+rizaon 
zuw) 的 计算 结果 如 图 6. 11 所 示 。 

综 上 讨论 可 见 , 无 论 是 利用 收益 率 平稳 化 还 是 利用 对 数 线性 去 趋势 平稳 化 方 
法 ,线性 宛 余 的 显著 性 检验 统计 量 的 数值 都 小 于 1. 96, 这 表明 原 实测 时 间 序 列 与 
替代 时 间 序 列 的 线性 依赖 结构 是 一 样 的 , 即 替代 时 间 序 列 在 技术 上 是 好 的 ,不 应 该 
产生 虚假 的 检验 结果 .但 非 线 性 宛 余 的 显著 性 检验 统计 量 的 数值 较 大 (之 1. 96), 则 
拒绝 零 假设 1, 因 此 可 以 认为 上 海 证 券 市 场 分 类 指数 时 间 序 列 不 是 线性 高 斯 随机 
序列 ,而 是 具有 非 线性 特性 。 

零 假 设 2: 时 间 序 列 来 自 具 常 系数 的 高 斯 线性 随机 过 程 经 过 单调 静态 非 线 性 
变换 。 

利用 2. 5. 1 节 中 迭代 的 幅度 调节 Fourier 变换 (IAAFT) 方 法 生产 19 组 替代 
多 变量 时 间 序 列 , 由 于 此 时 采用 的 是 Fourier 递归 型 快速 算法 ,要 求 时 间 序 列 长 度 
满足 N 一 23'5“Gij& 一 0,1,…) ,因此 从 原 1273 个 交易 日 中 截取 每 一 变量 长 度 为 
1250 的 四 变量 分 类 指数 时 间 序 列 。 


*150* 非 线性 时 间 序 列 分 析 及 其 应 用 


DIFFA 
DIFF 


0 10 20 30 
r 


(a) 线性 边缘 元 余 (b) 广义 边缘 元 余 P， 


DIFFA 


0 10 20 30 


r 


r 
(©) SRT (0) 广义 边缘 元 余 P， 


图 6.11 对 数 线性 去 趋势 后 的 分 类 指数 序列 在 零 很 设 1 下 的 显著 性 检验 统计 最 


对 经 过 收益 率 平稳 化 后 的 时 间 序 列 , 当 ~=0.4 时 ,经 计算 ,线性 元 余 的 显著 性 
检验 统计 量 DIFF LG s iz2eeeizsa sz 28 T HY [8] GEIB [8] B c 的 函数 如 图 6. 12(a) 
所 示 , 广 义 宛 余 显著 性 检验 统计 量 DIFFR, Cini Lentes an3 Lan) XE F AY fE) EB ME) 
隔 r 的 函数 如 图 6. 12(b)(q=1)、 图 6. 12€ (4 — 2) IIS 6. 12(d) (94 — 3 BER X 

可 见 , 线 性 宛 余 的 显著 性 检验 统计 量 的 数值 除 = 1,2 外 几乎 都 很 小 ;r=1,2 
时 较 大 ,这 可 能 是 由 于 时 间 间 隔 延 迟 和 样本 不 够 ,而 非 线 性 宛 余 的 显著 性 检验 统计 
量 的 数值 都 大 于 1. 96, 这 样 可 以 拒绝 零 假 设 2。 因 此 可 以 认为 ,上 海 证 券 市 场 分 类 
指数 序列 不 是 具 常 系数 的 高 斯 线性 随机 过 程 经 过 单调 静态 非 线 性 变换 获得 的 ,而 
是 具有 非 线性 特性 。 

线性 边缘 元 余 1MCzini zzn+rizangzin) 与 广义 边缘 宛 余 Pal Lini Lanes mit 
Zz4.n) 的 显著 性 检验 统计 量 DIFFACzi,si zzs+rizaaizta) 和 DIFFes(zinizazn+rizaos 
ztm) 的 计算 结果 如 图 6. 13 SER. 

可 以 发 现 线性 边缘 元 余 显 著 性 检验 统计 量 的 数值 除了 r=1,2 外 都 很 小 ,9 一 1 
时 的 非 线 性 元 余 显著 性 检验 统计 量 却 很 小 不 能 拒绝 零 假 设 。 而 下 面 可 以 看 到 对 数 
线性 去 趋势 平稳 化 方法 不 存在 这 样 的 问题 ,这 或 许 正如 文献 [166] 所 说 的 收益 率 的 
4R(1) 残 差分 析 可 能 掩盖 了 显著 性 信息 ,收益 率 平稳 化 在 样本 不 足 而 采用 多 变量 
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图 6.12 收益 率 分 类 指数 序列 在 零 假设 2 下 的 显著 性 检验 统计 量 
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图 6.13 收益 率 分 类 指数 序列 在 零 假设 2 下 的 显著 性 检验 统计 重 
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IAAFT 替代 数据 法 情况 下 容易 掩盖 显著 性 信息 ,于 是 影响 了 q=1 时 的 非 线性 边 
缘 元 余 的 显著 性 检验 统计 量 DIFFR,Czinizzn+rizasizta)。g 一 2,3 时 的 非 线性 宛 
余 显著 性 检验 统计 量 可 以 有 效 地 拒绝 零 假设 2。 

对 经 过 对 数 线性 去 趋势 平稳 化 后 的 时 间 序 列 , 当 > 一 0.1 时 ,经 计算 ,线性 元 余 
的 显著 性 检验 统计 量 DIFFZL(zisizzs+rizaizto) 关 于 时 间 延 迟 间隔 c. 的 函数 如 
图 6. 14 GO BER ,广义 元 余 显著 性 检验 统计 量 DIFFR, (aini Lente} Loins Lem FL 
T8] SER [8] BS 的 函数 如 图 6. 14 (b) (9 — 1), M 6. 14(c) (g=2) AIM 6. 14 (00 (g=3) 
BUR. 
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图 6. 14 ”对 数 线性 去 趋势 后 分 类 指数 序列 在 零 假设 2 下 的 显著 性 检验 统计 其 

线性 边缘 元 余 AC rin Ernies Lani 4.n) 与 广义 边缘 元 余 pa (Lins xerit 
zx4.n) 的 显著 性 检验 统计 量 DIFFAGn o irons imo A DIFF 04 Tini Lente Tani 
zim) 的 计算 结果 如 图 6.15 所 示 。 

可 见 , 线 性 元 余 的 显著 性 检验 统计 量 的 数值 都 小 于 1. 5, 这 表明 原 实测 时 间 序 
列 与 替代 时 间 序 列 的 线性 依赖 结构 是 一 样 的 , 即 蔡 代 时 间 序 列 在 技术 上 是 好 的 ,不 
应 该 产生 虚假 的 检验 结果 ,但 非 线 性 元 余 的 显著 性 检验 统计 量 的 数值 较 大 
(之 1. 96), 则 拒绝 零 假设 2。 因此 可 以 认为 ,上 海 证 券 市 场 分 类 指数 时 间 序 列 不 是 来 
自 具 常 系数 的 高 斯 线性 随机 过 程 经 过 单调 静态 非 线性 变换 ,而 是 具有 非 线性 特性 。 

上 面 利用 两 种 多 变量 时 间 序 列 替代 数据 生成 技术 , 即 随机 相位 化 的 Fourier 
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变换 (FT) 和 迭代 的 幅度 调节 Fourier 变换 (IAAFT) 检 验 了 上 海 证 券 市 场 分 类 指 
数 时 间 序 列 的 非 线性 ,以 线性 元 余 统 计量 检验 生成 的 替代 数据 的 好 坏 , 而 当 线 性 元 
余 的 显著 性 检验 统计 量 保证 了 生成 的 替代 时 间 序 列 在 技术 上 是 好 的 时 ,用 非 线性 
元 余 统 计量 检验 原 时间 序 列 的 非 线性 性 方 能 保证 检验 结果 的 有 效 性 。 采 用 线性 元 
余 和 非 线 性 元 余 两 种 统计 量 ,更 能 避免 虚假 检验 , 且 非 线性 元 余 可 用 广义 关联 积分 
计算 ,具有 计算 简便 、 速 度 快 等 优点 。 
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图 6. 15 对 数 线性 去 趋势 后 分 类 指数 序列 在 零 假设 2 Fi Sd ER e ici EE 
计算 结果 表明 这 种 方法 是 可 靠 的 ,检测 到 上 海 证 券 市 场 分 类 指数 时 间 序列 具 
有 非 线性 特性 , 它 不 是 线性 高 斯 随机 序列 ,也 不 是 高 斯 随机 序列 ,这 一 结论 与 用 
R/S 分 析 法 得 到 的 结果 相 吻 台 5” ,表明 了 上 海 证 券 市 场 确实 不 是 线性 系统 ,对 
传统 的 市 场 有 效 性 假设 提出 了 疑问 。 


6.3 ”上海 证 券 市 场 单 变量 指数 序列 的 预测 研究 


传统 的 证 券 市 场 指数 序列 的 预测 是 基于 有 效 市 场 假设 的 ,该 假设 认为 价格 反 
映 了 所 有 的 公开 信息 ,价格 只 有 在 收 到 新 的 信息 时 才 会 变动 ,因此 证 券 市 场 是 服从 
正春 分 布 的 。 但 大 量 研究 表明 实际 情况 不 是 这 祥 ,证 券 市 场 是 非 线性 的 ,具有 某 种 
确定 性 甚至 混沌 特征 ,而 不 是 随机 的 ,因此 基于 非 线 性 时 间 序 列 分 析 方 法 对 证 券 市 
场 的 指数 序列 进行 短期 预测 是 可 能 的 和 可 行 的 。 
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631 样本 数据 及 相 空间 重 构 


取 1997 年 1 月 2 日 到 2002 年 4 月 30 日 的 上 海 证 券 市 场 综合 指数 已. 作为 研 
究 对 象 , 其 时 间 历 程 图 如 图 6. 16 所 示 。 
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图 6.16 上 海 证 券 市 场 综合 指数 的 时 间 历 程 图 
为 了 消除 证 券 市 场 指数 时 间 序列 有 随 经 济 增长 的 趋势 ,利用 对 数 线性 去 趋势 
平稳 化 方法 。 首 先 以 InP, 为 因 变 量 ,n 为 自 变量 , 作 一 阶 线性 回归 , 即 求 直 线 a+ 
bn, 使 其 到 各 点 InP, 的 距离 平方 和 最 小 ,由 此 可 求 得 ae 必 的 值 。 然 后 作 残 差 , 可 得 
时 间 序 列 (z,}, 即 
z, = InP, — (a + bn) (6. 9) 
采用 对 数 线性 去 趋势 平稳 化 方法 得 时 间 序 列 {z,}*-, 的 时 间 历 程 图 如 图 6. 17 所 示 。 
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6.17. 上 海 证 券 市 场 综合 指 数 经 对 数 线性 去 趋势 后 的 时 间 历 程 图 
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下 面 对 经 过 对 数 线性 去 趋势 后 的 时 间 序列 进行 相 空 间 重 构 。 首 先 ,用 平均 互信 
息 法 求 延 迟 问 隔 r+, 计算 结果 如 图 6. 18 所 示 。 


平均 互信 息 


图 6.18 平均 互信 息 法 关于 延迟 间隔 c 的 变化 情况 

由 图 6. 18 可 以 看 出 ,平均 互信 息 曲 线 在 c9 24 处 取得 第 一 个 极 小 值 ,所 以 对 
数 线性 去 趋势 后 的 时 间 序列 的 延迟 时 间 取 为 + 二 24。 

然后 利用 虚假 最 近邻 点 法 求 嵌入 维 数 m, 重 构 后 计算 的 虚假 最 近邻 点 百分比 
对 维 数 的 变化 情况 如 图 6. 19 所 示 。 
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图 6.19 虚假 最 近邻 点 百分比 对 维 数 的 变化 情况 


由 于 股市 数据 中 存在 着 噪声 ,所 以 当 维 数 增加 到 足够 大 时 ,图 6. 19- 中 虚假 最 
近邻 点 的 百分比 达 不 到 零 。 但 当 m= 二 8 时 ,虚假 最 近邻 点 的 百分比 达到 最 小 ,因此 
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取 媒 入 维 数 约 为 8。 
这 样 可 对 经 对 数 线性 去 趋势 后 的 上 海 证 券 市 场 综合 指数 做 以 下 相 空间 重 构 


En = (Eny Ennes sac) (6. 10) 
6.3.2 基于 正则 化 的 自 适应 预测 


在 对 经 过 对 数 线性 去 趋势 后 的 上 海 证 券 市 场 综合 指数 进行 预测 时 ,把 观测 数 
据 分 成 两 个 部 分 ,其 中 后 100 个 点 用 来 检验 预测 效果 。 

在 基于 正则 化 方法 进行 上 海 证 券 市 场 指数 时 间 序 列 预测 时 ,采用 主 成 分 回归 
(PCR) 时 ,要 确定 参数 g 的 值 ,为 此 必须 知道 吸引 子 的 分 形 维 数 .文献 [173,174] 均 
对 上 海 证 券 市 场 综合 指数 的 分 形 维 数 进行 了 研究 ,都 给 出 了 其 分 形 维 数 在 2 和 3 
之 间 的 结论 ,于 是 这 里 取 q—3. 

为 了 检验 用 虚假 最 近邻 点 法 求 出 的 嵌入 维 疾 =8 是 否 合适 ,考虑 其 邻近 的 值 ， 
即 取 嵌 入 维 数 分 别 为 5 一 10 进行 相 空 间 重 构 (r 均 取 24), 利 用 普通 最 小 二 乘 的 局 
部 线性 预测 法 (OLS) 和 正则 化 的 局 部 线性 预测 法 (PCR，RR) ,计算 一 步 预测 的 正 
规 化 均 方 根 误差 ,结果 如 图 6. 20 所 示 ( 对 PCR , 选 参数 g WY, ER 7)。 利 用 自 适 
应 的 局 部 线性 预测 法 计算 一 步 预 测 的 正规 化 均 方 根 误差 ,结果 如 图 6. 21 所 示 ; 具 
体 数 值 如 表 6. 7 所 示 。 
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图 6. 20 天 一 15 时 的 一 般 局 部 线性 化 法 预测 的 误差 

比较 图 6. 20 与 图 6. 21( 或 表 6.7) 可 以 清楚 地 看 出 ,对 上 海 证 券 市 场 综合 指数 
进行 的 一 步 预 测 , 自 适应 局 部 线性 化 方法 好 于 一 般 局 部 线性 化 方法 ,并 且 由 各 种 方 
法 计算 出 的 误差 在 m —8 处 出 现 明 显 下 降 , 特 别 对 于 自 适应 局 部 线性 化 法 ,m= 二 8 
时 的 误差 是 最 小 的 (虽然 RR 算法 在 m= 二 9 处 达到 最 小 ,但 与 m —8 处 的 误差 相差 
不 大 ), 所 以 用 虚假 最 近邻 点 法 求 出 的 嵌入 维 数 是 比较 理想 的 。 
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图 6.21 自 适应 局 部 线性 化 法 预测 的 误差 
表 6.7 上 海 证 券 市 场 综合 指数 一 步 预测 正规 化 均 方 根 误 可 NRMSE 


方法 m-5 m=6 m=7 m=8 m=9 m=10 


0. 2769 0.2778 


0. 1528 0. 1506 


0.1773 0.1833 


0.1781 0.1817 


0. 1479 0.1479 


RR 0. 1463 0. 1496 0. 1545 0. 1445 0. 1439 0. 1483 


IR m—8,c—24 重 构 相 空间 ,并 以 RR 算法 为 例 ,分 别 用 一 般 局 部 线性 化 方法 
和 自 适应 局 部 线性 化 方法 给 出 对 最 后 100 个 点 的 一 步 预测 值 和 实际 值 的 比较 , 结 
果 如 图 e. 22 和 图 6. 23 所 示 。 

对 比 图 6. 22 和 图 6. 23 可 以 很 明显 地 看 出 ,用 自 适 应 局 部 线性 化 方法 作 的 一 
步 预 测 , 其 结果 与 真实 值 比较 接近 , 且 对 指数 的 每 个 高 点 和 低 点 的 描述 和 实际 情况 
一 致 。 用 一 般 局 部 线性 化 法 作 的 一 步 预测 ,不 仅 误差 增 大 了 ,而 且 对 细节 的 描述 也 
有 所 减弱 ,表明 自 适应 局 部 线性 化 法 好 于 一 般 局 部 线性 化 法 , 它 是 一 个 更 稳健 的 
方法 。 

关于 上 海 证 券 市 场 单 变量 指数 时 间 序 列 的 预测 我 们 还 从 不 同 的 角度 进行 了 研 
究 , 详 见 文献 [175 一 177] 。 
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图 6. 22 ”对 数 线性 去 趋势 后 上 证 综合 指数 的 一 般 局 部 线性 化 一 步 预 测 
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图 6.23 对 数 线性 去 趋势 后 的 上 证 综合 指数 的 自 适应 局 部 线性 化 一 步 预测 


6.4 上 海 证 券 市 场 多 变量 指数 序列 的 预测 研究 


目前 ,大 量 关于 证 券 市 场 指数 序列 的 预测 研究 都 是 基于 单 变量 时 间 序列 的 ,但 
证 券 市 场 中 往往 可 以 获取 多 变量 时 间 序 列 , 它 们 包含 比 单 变量 时 间 序 列 更 多 的 信 
息 .根据 第 五 章 的 讨论 ,多 变量 时 间 序列 的 预测 效果 要 比 单 变 量 时 间 序列 的 预测 效 
果 好 ,因此 本 节 利用 上 海 证 券 市 场 的 综合 指数 和 成 交 金额 构 成 两 变量 时 间 序 列 , 从 
中 对 综合 指数 进行 预测 研究 。 
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6.4.1 样本 数据 及 相 空间 重 构 


选取 上 海 证 券 市 场 的 每 日 收盘 指数 , 即 上 证 综合 指数 作为 研究 对 象 ,样本 选取 
1999 年 1 月 4 日 至 2003 年 12 月 31 日 的 上 海 证 券 市 场 综合 股指 和 成 交 金 额 各 
1196 个 数据 ,P 表示 综合 股指 ,Q 表示 成 交 金 额 指数 ,于 是 得 到 两 个 时 间 序 列 
(P, REIR Q, at, mE 6. 24 和 图 6. 25 所 示 。 
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图 6.24 上 海 证 券 市 场 综合 股指 序列 时 间 历 程 图 


n 


图 6. 25 上 海 证 券 市 场 成 交 金额 指数 序列 时 间 历 程 图 
为 了 使 这 两 组 时 间 序 列 有 可 比 性 ,将 时 间 序 列 {P,) 于 和 {Q,) 分 别 进行 标准 
化 , 即 


Pi— Pu 
Pp n=1,2,.…,1196 (6.11) 


Xia = 
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NM EDT 
7 Qu — Quin 


DORE ELAR THER EE ſal HERI Gs ELAM cs et» MED 6. 26 和 图 6. 27 所 示 。 


n—]1,2,7,1196 (6. 12) 
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图 6. 26 ”上海 证 券 市 场 综合 股指 序列 标准 化 后 的 时 间 历 程 图 
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图 6.27 上 海 证 券 市 场 成 交 金额 指数 序列 标准 化 后 的 时 间 历 程 图 


SCAR C178] P UE BÀ T H Cni EAD (cs 222038 Hg BU] B 2 [8] GP 
{Q,js 重 构 的 相 空间 具有 相同 的 最 佳 延 迟 时 间 间 隔 和 媒 入 维 数 , 且 它 们 的 关联 维 
数 和 Lyapunov 指数 等 几何 不 变量 也 是 一 样 的 。 因 此 ,可 以 直接 利用 {zn 
{zz.n)! 当 来 重 构 相 空间 进行 预测 。 

为 了 比较 预测 结果 ,用 下 列 两 种 方式 重 构 吸 引子 .第 一 种 方式 是 用 单 变 量 局 部 
多 项 式 预 测 法 重 构 吸引 子 。 由 平均 互信 息 法 和 L. Y. Cao 的 方法 C5 ,得 到 r 一 34 和 
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mm 二 9。 因 此 重 构 向 量 为 
To = {Lins Lynne Tne Xj aa] (6.13) 
第 二 种 方式 是 用 多 变量 局 部 多 项 式 预 测 法 重 构 吸 引子 。 利 用 4. 3. 3 节 提 出 的 虚假 
最 近邻 点 法 确定 媒 入 维 数 算法 的 改进 算法 ,得 0 = 34,0 735 mi = 5,m — 3, MY 
m 二 8。 因 此 重 构 向 量 为 
Ln = nasa Linte Tlse Tian Zan Ton ty Tene) (6. 14) 
对 双 变 量 时 间 序列 {zio,zz*js ,前 1100 个 数据 用 于 训练 样本 ,后 96 个 数据 用 于 
预测 。 


6.4.2 局 部 多 项 式 预测 


下 面 利用 第 五 章 提出 的 多 变量 时 间 序 列 的 局 部 多 项 式 预测 法 对 标准 化 后 的 上 
海 证 券 市 场 综合 指数 ( 即 第 一 个 变量 ) 进 行 预测 。 取 邻 点 数 为 天 =80, 在 式 (5.19) 
中 分 别 取 多 项 式 阶 数 ;==2 和 预测 步 数 p — 1, 一 步 预 测 的 均 方 根 误差 和 正规 化 均 
方 误差 如 表 6. 8 所 示 。 


表 6.8 单 变量 和 两 变量 局 部 多 项 式 预测 的 一 步 预测 误 状 


方法 时 间 序 列 均 方 根 误差 RMSE 正规 化 均 方 误差 NMSE 
单 变量 0.0276 0. 4452 
ABS AAT 
£u 0.0175 0.1798 
— 


由 表 6. 8 知 ,用 多 变量 局 部 多 项 式 法 预测 的 结果 很 好 地 预测 了 真实 的 时 间 序 
列 ,并 且 当 使 用 相同 邻 点 数 时 这 种 方法 预测 结果 明显 优 于 单 变量 情形 ,如 图 6. 28 
所 示 。 因 此 ,这 种 多 变量 的 局 部 多 项 式 预测 方法 是 成 功 的 。 


一 一 观测 值 
一 一 俐 出 值 ( 单 变量 ) 
一 一 预测 值 (多 变量 ) 


A am 


图 6. 28 局 部 多 项 式 预测 法 预测 上 海 综合 股指 的 最 后 96 个 数据 
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643 基于 正则 化 的 局 部 线性 和 局 部 多 项 式 预测 


下 面 利 用 5. 4 节 提出 的 基于 正则 化 的 多 变量 时 间 序 列 的 局 部 线性 和 局 部 多 项 
式 预测 法 对 标准 化 后 的 上 海 证 券 市 场 综合 指数 进行 预测 。 仍 取 mm = 34,02 — 25, 
mi 二 5,ms 二 3, 重 构 向 量 见 式 (6. 14). IIE BE RS [8] FF Cris ren smi BL 1100 个 
数据 用 于 训练 样本 ,后 96 个 数据 用 于 预测 .根据 文献 [173,174] 对 上 海 综合 指数 的 
分 形 维 数 进行 了 研究 ,给 出 了 其 分 形 维 数 在 2 和 3 之 间 的 结论 , 故 对 PCR 取 正 则 
化 参数 g=3; 对 RRR p= 采用 正规 化 均 方 根 误差 NRMSE 来 衡量 一 步 预测 的 
精度 ,图 6. 29 表示 分 别 利用 普通 最 小 二 乘 的 局 部 线性 预测 法 (OLS) 和 利用 正则 化 
的 局 部 线性 预测 法 (PCR ,RR) 对 标准 化 后 的 上 海 证 券 市 场 综合 指数 最 后 96 个 数 
据 进 行 一 步 预 测 得 到 的 正规 化 均 方 根 误差 NRMSE。 
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图 6. 29 标准 化 后 的 上 海 证 券 市 场 综合 指数 的 局 部 线性 预测 的 一 步 预 测 误差 
图 6. 30 表示 分 别 利用 普通 最 小 二 乘 的 局 部 多 项 式 预 测 法 (OLS) 和 利用 正则 
化 的 局 部 多 项 式 预 测 法 (PCR，RR) 对 标准 化 后 的 上 证 综合 指数 最 后 96 个 数据 进 
行 一 步 预测 的 正规 化 均 方 根 误差 NRMSE 此 时 取 多 项 式 的 阶 数 ;二 2, 则 待定 系数 
PBI = 3424120 C - 212 30, 


ti 


R 6.9 表示 不 同 邻 点 天 下 分 别 利用 普通 最 小 二 乘 的 局 部 线性 预测 法 (OLS) 
和 利用 正则 化 的 多 变量 局 部 线性 预测 法 (PCR，RR 对 标准 化 后 的 上 证 综合 指数 
最 后 96 个 数据 进行 预测 的 一 步 预测 误差 值 比较 。 
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图 6.30 标准 化 后 的 上 海 证 券 市 场 综 合 指数 的 局 部 多 项 式 预 测 的 一 步 预测 误差 
表 6.9 上 证 综合 股指 的 局 部 线性 预测 法 的 正规 化 均 方 根 误差 NRMSE 
K>m K=m K<m 
NRMSE 


14 13 12 n 10 9 8 7 
OLS 0.0981 | 0.1136 | 0.1189 | 0.1708 | 0.2184 | 7.3450 = - 


PCR 0.0980 | 0.1003 | 0.0888 | 0.1015 | 0.0933 | 0.0960 | 0.0952 0. 0968 


RR 0.0894 | 0.0975 | 0.0939 | 0.0935 | 0.1403 一 = 


3X 6.10 表示 不 同 邻 点 K 下 分 别 利 用 普通 最 小 二 乘 的 局 部 多 项 式 预 测 法 
(OLS) 和 利用 正则 化 的 局 部 多 项 式 预测 法 (PCR，RR) 对 标准 化 后 的 上 海 证 券 市 
场 综合 指数 最 后 96 个 数据 进行 预测 的 一 步 预测 误差 值 比较 。 

表 6.10 上 证 综合 股指 的 局 部 多 项 式 预测 法 的 正规 化 均 方 根 误 状 NRMSE 


K>J K<J 


35 34 33 32 31 30 29 28 


OLS 0.2239 | 0.2247 | 0.2436 | 0.3009 | 0.8708 | 3.2265 | 8.2326 2.1346 


PCR 0.1136 | 0.1132 | 0.1143 | 0.1127 | 0.1118 | 0.1125 | 0.1094 0. 1094 


RR 0.0627 | 0.0628 | 0.0617 | 0.0634 | 0.0755 = * * 


图 6. 29, #8 6. 9 及 图 6. 30、 表 6. 10 的 预测 结果 表明 , 当 邻 点 数 远大 于 嵌入 维 
数 m( 局 部 线性 预测 ) 或 待定 系数 个 数 J( 局 部 多 项 式 预测 ) 时 ,利用 最 小 二 乘法 与 
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正则 化 方法 的 多 变量 局 部 线性 预测 法 和 多 变量 局 部 多 项 式 预 测 法 对 上 海 证 券 市 场 
综合 股指 的 预测 误差 均 较 小 , 且 正 则 化 法 的 预测 结果 均 要 优 于 最 小 二 乘法 的 预测 
结果 。 当 邻 点 数 接近 或 小 于 嵌入 维 数 m 或 待定 系数 个 数 本 时 ,利用 最 小 二 乘法 与 
正则 化 方法 的 多 变量 局 部 线性 预测 法 和 多 变量 局 部 多 项 式 预测 法 对 上 海 证 券 市 场 
综合 股指 的 预测 误差 均 有 所 增 大 ,但 利用 最 小 二 乘法 的 一 般 多 变量 局 部 线性 预测 
法 和 多 变量 局 部 多 项 式 预 测 法 预测 误差 增幅 最 大 且 最 终 失 效 , 而 正则 化 方法 中 的 
PCR 法 仍 有 较 小 的 预测 误差 。 

上 面 利用 了 三 种 多 变量 非 线性 时 间 序 列 的 预测 法 , 即 多 变量 局 部 多 项 式 预测 
法 、 基 于 正则 化 的 多 变量 局 部 线性 预测 法 和 基于 正则 化 的 多 变量 局 部 多 项 式 预测 
法 对 上 海 证 券 市 场 的 综合 股指 进行 预测 。 预 测 结果 表明 这 三 种 方法 都 是 有 效 的 , 且 
表明 多 变量 的 局 部 多 项 式 预测 法 预测 效果 要 比 单 变量 局 部 多 项 式 预测 法 精确 , 基 
于 正则 化 的 多 变量 局 部 线性 预测 法 和 基于 正则 化 的 多 变量 局 部 多 项 式 预测 法 的 预 
测 效 果 比 一 般 的 多 变量 局 部 线性 预测 法 和 多 变量 局 部 多 项 式 预 测 法 好 ,其 抗 噪 性 
更 强 且 应 用 范围 更 广泛 。 
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